hadoop2.2 hdfs

来源:互联网 发布:2017java的就业前景 编辑:程序博客网 时间:2024/06/14 16:04
  • hdfs 变动

            开始使用多个namenode,避免namenode的单点故障。多个namenode是不容许交互的。

            block pool

            每个namenode 都会有一个自己独立的block pool 用于存储集群上所有datanode的信息,也就是每个namenode都可以独立使用,所存储的数据是一个全集。 所以当一个datanode 产生一个block 时,正好一个namenode单点故障,但是这不会影响到该block。

           Namespace Volume

           block pool和namenode和一起称为Namespace Volume,这个是2.2新提出的概念。

       HDFS Federation Architecture

     ClusterID

       用于标识该集群的唯一标识符,该ID在namenode format时产生或者指定。hdfs namenode -format -clusterid xxxxx。

  • conf中新增配置
    <configuration>  <property>    <name>dfs.nameservices</name>    <value>ns1,ns2</value>  </property>  <property>    <name>dfs.namenode.rpc-address.ns1</name>    <value>nn-host1:rpc-port</value>  </property>  <property>    <name>dfs.namenode.http-address.ns1</name>    <value>nn-host1:http-port</value>  </property>  <property>    <name>dfs.namenode.secondaryhttp-address.ns1</name>    <value>snn-host1:http-port</value>  </property>  <property>    <name>dfs.namenode.rpc-address.ns2</name>    <value>nn-host2:rpc-port</value>  </property>  <property>    <name>dfs.namenode.http-address.ns2</name>    <value>nn-host2:http-port</value>  </property>  <property>    <name>dfs.namenode.secondaryhttp-address.ns2</name>    <value>snn-host2:http-port</value>  </property>  .... Other common configuration ...</configuration>
  • hdfs 新增功能权限管理

             该功能可以在hdfs-site.xml 中 dfs.permissions=false,可以禁用掉。

             相关http://hadoop.apache.org/docs/r2.2.0/hadoop-project-dist/hadoop-common/FileSystemShell.html#du

原创粉丝点击