程序博客网 > 淘宝美工有学历要求吗

HDFS Federation机制

来源：互联网发布：淘宝美工有学历要求吗编辑：程序博客网时间：2024/05/27 20:51

一 HDFS1.x逻辑结构

HDFS1.x使用一个NameNode来管理文件系统命名空间和数据块信息，使用DataNode来提供块的存储和访问。这种架构比较简单，但是缺点也大：

1、受限制于NameNode的内存大小：NameNode在内存保存了整个文件系统的元数据，所以内存大小直接限制了文件系统的大小

2、影响HDFS吞吐量：因为文件的读写都需要和NameNode交互，如果NameNode很繁忙了，那么势必降低文件系统吞吐量。

3、无法做到数据或者资源的有效隔离

4、命名空间和数据块管理高度耦合，难以让其他服务单独使用数据块存储功能

5、只有一个NameNode存在单点故障问题

二 HDFS2.x 逻辑结构

为了能够水平扩展NameNode,HDFS2.x引入了联盟的机制，我们可以定义多个NameNode，每一个NameNode各自管理着自己的命名空间和BlockPool.HDFS集群中的DataNode负责提供数据块共享存储的功能，每一个DataNode都会向每一个NameNode注册，周期性发送心跳报告和数据块等，然后执行NameNode回传的响应指令

BlockPool: 管理当前命名空间中存储在集群中DataNode上所有的数据块信息，每一个BlockPool也是独立的，不同NameNode之间不会相互影响。当一个NameNode出现故障，并不会影响集群中其他的NameNode

NamespaceVolume: 一个NameNode的命名空间和BlockPool被称为命名空间卷，主要是作为一个统一的管理单元，方便NameNode管理。当NameNode/Namespace删除后，所对应的blockpool也会从其集群删除；集群升级的时候。每一个命名空间卷都会作为一个基本的升级单元。

注意：

一定要指定与原集群相同的clusterId来format新的NameNode,代表新的NameNode隶属于原集群

hdfsnamenode -format -clusterId <cluster_id>

在所有的DataNode节点同步以上修改过的hdfs-site.xml配置,逐个重启DataNode即可.注册成功后,在DataNode的datadir数据存储目录下将会多出一个blockpool的存储目录

一个blockpool对应一个namespace.DataNode通过建立多个blockpool目录的方式实现了DataNode的存储共享.如果重启DataNode的时候,你发现DataNode启动失败了,并出现如下所示的错误

这个时候再次确认新的NameNode是否是用原集群的clusterformat的.ClusterId不匹配就会导致DataNode启动出现上图所示的错误.但是有的时候我们并不想让所有的DataNode都添加到每个NameNode,比如对于用于冷数据存储的机器我只想把它加入到77所在的原NameNode上.这个时候HDFS能支持吗?答案是确定的.添加如下配置表明目标注册的nameservice.

对于HDFSFederation引入的多nameservice的问题,会让客户端程序维护多个nameservice,以及这些对应namespace所存储的具体文件目录,namespace多了,这个问题会显得比较麻烦,一个优化的做法是用viewFs来解决,在客户端配置上增加一个mounttable.让客户端访问的是一个逻辑意义上的filesystem,无须更改目标指向的filesystem.这样可以同时应用HDFSFederation和viewFs的优势,无疑是一个更好的选择.

阅读全文

0 0

淘宝美工有学历要求吗

淘宝美工有学历要求吗

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子海淘哪些网站好淘艺艺淘淘海淘精淘宜淘淘乐在线 brita滤水壶德淘湖州德清德清德清县德清人才网德清旅游德清房产德清108社区浙江德清德清房价徐德清杭州德清彭德清德清莫干山德清景点德清楼盘德清找工作德清相亲会德清酒店德清特产杭州到德清德清吧德清到杭州德清新楼盘德清莫干山莫干山德清德清新楼盘德清做网站德清在哪里德清站德清桐乡德清景区德清旅游德清楼盘