Ubuntu Hadoop 2.x 动态添加节点

来源：互联网发布：淘宝网睡衣冬装男装编辑：程序博客网时间：2024/05/16 17:01

spark，hadoop交流群，QQ群号：521066396，欢迎加入共同学习，一起进步，没有广告~
一、Hadoop运行环境配置
1、修改系统hostname(/etc/hostname文件)
2、修改hosts文件，将集群所有节点hosts配置进去(/etc/hosts文件)
3、设置主节点到新增节点的免密码登录
将主节点的~/.ssh目录下的id_rsa.pub文件内容添加至每个新增节点的~/.ssh目录下的authorized_keys文件中
4、修改主节点slave文件，添加新增节点的ip信息
5、将hadoop的配置文件scp到新增的节点上
新增节点中需要注意的一点是如果hadoop目录下有日志文件或者数据文件，特别是数据文件，记得在复制hadoop目录的时候在新节点上把这些东西清一下。其中包括hadoop根目录下的dfs，logs，tmp文件夹。
二、添加DataNode
对于新添加的DataNode节点，需要启动datanode进程，从而将其添加入集群
1、在新增的节点上，运行sbin/hadoop-daemon.sh start datanode
2、然后在主节点通过hdfs dfsadmin -report查看集群情况
3、最后还需要对hdfs负载设置均衡，因为默认的数据传输带宽比较低，可以设置为64M，即hdfs dfsadmin -setBalancerBandwidth 67108864即可
默认balancer的threshold为10%，即各个节点与集群总的存储使用率相差不超过10%，我们可将其设置为5%
4、然后启动Balancer，sbin/start-balancer.sh -threshold 5，等待集群自均衡完成即可
三、添加NodeManager
由于Hadoop 2.X引入了YARN框架，所以对于每个计算节点都可以通过NodeManager进行管理，同理启动NodeManager进程后，即可将其加入集群
在新增节点，运行sbin/yarn-daemon.sh start nodemanager即可
在ResourceManager，通过yarn node -list查看集群情况
参考：http://my.oschina.net/leoleong/blog/477508

0 0