Hadoop之文件副本是如何存储的

来源:互联网 发布:java axis简单入门 编辑:程序博客网 时间:2024/06/08 17:54

文件副本存储策略(replication policies):将第1个副本存储在本地机架节点上;第2个存储在与第1个相同机架的另一个节点上;第3个放在不同机架的任意一个节点上。(若副本多于3个则剩下的副本随机存储在集群其他机架中。

其他:Block块设置的比较大是为了最小化寻址开销。但也不会设置太大,如果设置太大会导致任务数过少,作业运行速度就会比较慢。


这里写图片描述
2015年10月21日晚

0 0