hadoop的负载均衡学习

来源:互联网 发布:光翼网络班视频 编辑:程序博客网 时间:2024/06/05 18:32

一般般情况下,数据在录入集群的时候就进行负载均衡,根据各个节点的情况来做数据平衡分发存放。但是如果在新增节点之后,如果想做到负载均衡则需要使用balancer的命令。对于这个命令,一般是有一个阀值,默认是10%也就是说,节点之间差额不过10%,集群认为就是均衡的。当然,负载的越平均,查询相对也较快,但是均衡的过程会耗时不少。

1、新添加节点到集群,启动节点机器

sh hadoop-daemon.sh start datanodesh hadoop-daemon.sh start tasktracker
2、启动balancer命令
sh stop-balancer.sh
3、查看进程jps
15294 NameNode15961 Balancer15553 JobTracker15473 SecondaryNameNode16162 Jps
可以看到balancer已启动

原创粉丝点击