【转 】Hadoop datanode添加与删除
来源:互联网 发布:java什么是线程和进程 编辑:程序博客网 时间:2024/06/04 23:34
出处:http://zzhblog.sinaapp.com/?p=82
一、 Hadoop节点热拔插
在Hadoop集群中经常会进行增添节点操作,即实现节点的热拔插。在这些操作中不希望对集群进行重启。
2.在集群中添加节点:
a. 把新节点IP或者主机名字加入到主节点的slaves文件。
b. 登录到新节点,执行:
1
2
3
cd
$HADOOP_HOME
bin
/hadoop-daemon
.sh start datanode
bin
/hadoop-daemon
.sh start tasktracker
3. 从集群中移走节点,且对移走节点的数据进行备份:
a. 在主节点的core-site.xml配置文件中添加
1
2
3
4
5
<
property
>
<
name
>dfs.hosts.exclude</
name
>
<
value
>/usr/local/hadoop/conf/exclude</
value
>
<
description
>A base for other temporary directories.</
description
>
</
property
>
b. 在主节点的$HADOOP_HOME/conf/目录下新建文件excludes,每行为需要移走的节点,该例为s140。
c. 运行命令:
1
hadoop dfsadmin -refreshNodes
该命令可以动态刷新dfs.hosts和dfs.hosts.exclude配置,无需重启NameNode。此刻datanode消失了,但是tasktracker还存在。
d. 然后热行命令,查看状态
1
bin
/hadoop
dfsadmin -report
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Name: 192.168.3.140:50010
Decommission Status : Decommission in progress
Configured Capacity: 310716715008 (289.38 GB)
DFS Used: 59891990052 (55.78 GB)
Non DFS Used: 20663939548 (19.24 GB)
DFS Remaining: 230160785408(214.35 GB)
DFS Used%: 19.28%
DFS Remaining%: 74.07%
Last contact: Fri Aug 13 10:17:20 GMT+08:00 2010
Name: 192.168.3.136:50010
Decommission Status : Normal
Configured Capacity: 487925370880 (454.42 GB)
DFS Used: 101679245034 (94.7 GB)
Non DFS Used: 55873218838 (52.04 GB)
DFS Remaining: 330372907008(307.68 GB)
DFS Used%: 20.84%
DFS Remaining%: 67.71%
Last contact: Fri Aug 13 10:17:21 GMT+08:00 2010
e. 在停掉节点Decommission Status不为Normal前, mapreduce操作会出现异常。
f. 节点移走64G数据需要十分钟左右。
二、 数据负载均衡
1. 在Hadoop集群中新添加一个Datanode时,需要对集群数据进行负载均衡。
2. 在主节点运行bin/start-balancer.sh命令,可以添加参数-threshold 5,threshold是平衡阈值,默认是10%,值越小负载越均衡,但需要更长的时间去执行。
3. 添加s140到集群,执行负载均衡半个小时共负载了4G的数据。
0 0
- 【转 】Hadoop datanode添加与删除
- Hadoop datanode添加与删除
- 【转】hadoop 添加删除datanode及tasktracker
- Hadoop动态添加删除datanode及tasktracker
- hadoop 添加删除datanode及tasktracker
- Hadoop动态添加删除datanode及tasktracker
- Hadoop动态添加删除datanode及tasktracker
- Hadoop 添加删除DataNode 和 TaskTracker
- hadoop 中添加和删除 datanode和tasktracker(一)
- hadoop 中添加和删除 datanode和tasktracker(二)
- Hadoop动态添加/删除节点(datanode和tacktracker)
- cui-----Hadoop动态添加删除datanode及tasktracker【需要整理】
- Hadoop添加节点datanode
- Hadoop添加节点datanode
- [Hadoop]Hadoop添加节点datanode
- hadoop集群在线添加datanode
- Hadoop节点添加与删除
- Hadoop DataNode与DFSClient交互
- Python urllib的urlretrieve()函数解析
- iOS空间使用之UISwitch
- 【转】hbase导出工具Export介绍
- 【转】修改hadoop的备份系数dfs.replication
- Java不同压缩算法的性能比较
- 【转 】Hadoop datanode添加与删除
- 【转】hadoop 添加删除datanode及tasktracker
- 【译】Nginx的if是如何工作的(How nginx "location if" works )By agentzh
- 路由表的优先原则
- 【转】Nginx关闭日志
- JavaScript - 解析JSON
- 关于邮政与高校合作管理的一些个人想法
- 程序打包
- 【转】支付宝代志远:HBase系统故障恢复的优化实践分享