Ubuntu Hadoop 2.x 动态添加节点

来源:互联网 发布:淘宝网睡衣冬装男装 编辑:程序博客网 时间:2024/05/16 17:01

spark,hadoop交流群,QQ群号:521066396,欢迎加入共同学习,一起进步,没有广告~
一、Hadoop运行环境配置
1、修改系统hostname(/etc/hostname文件)
2、修改hosts文件,将集群所有节点hosts配置进去(/etc/hosts文件)
3、设置主节点到新增节点的免密码登录
将主节点的~/.ssh目录下的id_rsa.pub文件内容添加至每个新增节点的~/.ssh目录下的authorized_keys文件中
4、修改主节点slave文件,添加新增节点的ip信息
5、将hadoop的配置文件scp到新增的节点上
新增节点中需要注意的一点是如果hadoop目录下有日志文件或者数据文件,特别是数据文件,记得在复制hadoop目录的时候在新节点上把这些东西清一下。其中包括hadoop根目录下的dfs,logs,tmp文件夹。
二、添加DataNode
对于新添加的DataNode节点,需要启动datanode进程,从而将其添加入集群
1、在新增的节点上,运行sbin/hadoop-daemon.sh start datanode
2、然后在主节点通过hdfs dfsadmin -report查看集群情况
3、最后还需要对hdfs负载设置均衡,因为默认的数据传输带宽比较低,可以设置为64M,即hdfs dfsadmin -setBalancerBandwidth 67108864即可
默认balancer的threshold为10%,即各个节点与集群总的存储使用率相差不超过10%,我们可将其设置为5%
4、然后启动Balancer,sbin/start-balancer.sh -threshold 5,等待集群自均衡完成即可
三、添加NodeManager
由于Hadoop 2.X引入了YARN框架,所以对于每个计算节点都可以通过NodeManager进行管理,同理启动NodeManager进程后,即可将其加入集群
在新增节点,运行sbin/yarn-daemon.sh start nodemanager即可
在ResourceManager,通过yarn node -list查看集群情况
参考:http://my.oschina.net/leoleong/blog/477508

0 0
原创粉丝点击