HDFS的dfs.replication不同验证
来源:互联网 发布:吃饭排队叫号软件 编辑:程序博客网 时间:2024/05/21 14:01
集群只有三个Datanode,hadoop系统replication=4时,会出现什么情况?文件块只有三份,hadoop fsck -locations 如图所示:
修改hadoop的备份系数dfs.replication
Hadoop中常常需要增加新的节点,或者变更备份系数。在完成这些操作后,往往出现数据未自动备份,或者数据节点不可用的情况。本文就讨论一下这个问题。
Hadoop的备份系数是指每个block在hadoop集群中有几份,系数越高,冗余性越好,占用存储也越多。备份系数在hdfs-site.xml中定义,默认值为3.
如何变更备份系数?
首先stop-all.sh停止节点,修改master节点的hdfs-site.xml文件,设置dfs.relication值为目标值。启动hadoop集群。
查看文件的备份系数:hadoop dfs -ls [filename] 结果行中的第二列是备份系数 (注:文件夹信息存储在namenode节点上,所以没有备份,故文件夹的备份系数是横杠)
在操作后会发现,以前文件的备份系数仍是原来的值。原来hadoop并不会自动的按照新的备份系数调整,我们需要手动完成。
查看hadoop集群的备份冗余情况:hadoop fsck / 我很喜欢的命令,可以方便的看到各种类型block所占比例。
我们发现Average block replication的值仍然为旧值,所以我们需要修改hdfs中文件的备份系数。
修改hdfs文件备份系数:hadoop dfs -setrep [-R] <path> 如果有-R将修改子目录文件的性质。hadoop dfs -setrep -w 3 -R /user/hadoop/dir1 就是把目录下所有文件备份系数设置为3.
如果再fsck时候出错,往往是由于某些文件的备份不正常导致的,可以用hadoop的balancer工具修复
自动负载均衡hadoop文件:hadoop balancer
查看各节点的磁盘占用情况 hadoop dfsadmin -report
- HDFS的dfs.replication不同验证
- hadoop的dfs.replication
- hadoop的dfs.replication
- Hadoop维护实战-设置hdfs副本数 dfs.replication
- hadoop的dfs.replication和dfs setrep
- 修改hadoop的备份系数dfs.replication
- DFS单向复制的疑问/Is it possible to configure one-way replication with DFS Replication?
- DFS Replication Health Report!
- dfs.replication 详解
- hdfs dfs
- hadoop的dfs.replication和备份数问题
- hadoop、hbase的数据备份数(dfs.replication)问题
- 【转】修改hadoop的备份系数dfs.replication
- 文件副本数量问题,设置的dfs.replication没有生效
- 修改hadoop的备份系数dfs.replication后操作
- Mysql不同主从格式(Replication Formats)的区别
- “hdfs dfs -ls”命令的使用
- hdfs dfs -ls 命令
- Prefix.pch 介绍
- 向量内积和夹角的关系
- Nginx配置文件nginx.conf中文详解
- NYOJ 746 整数划分(四)区间DP
- 如何调优JVM - 优化Java虚拟机
- HDFS的dfs.replication不同验证
- ios 本地通知
- Javascript语义分析器,教你如何实现Jquery库
- Python非root用户启动python multiprocessing的semlock,提示没有权限的解决方法
- Ejabberd外部组件开发
- Unity内部类实现GPS定位
- css3实现六边形照片展示
- BAT 批处理脚本 教程
- HTTP Live Streaming服务器的搭建