理解Hadoop分布式文件系统HDFS(二)
来源:互联网 发布:淘宝扒皮精灵家 编辑:程序博客网 时间:2024/06/05 03:24
hdfs federation--hdfs联邦,Hadoop 2.0以后引入的两大重要特性之一(HA和联邦)。HA保证了在主namenode节点出故障宕机之后,备namenode节点迅速接管主namenode工作,从而使得集群不间断的对外提供服务。hdfs在数据存储节点datanode上支持水平扩展,而namenode不支持水平切分。其所存储的文件数量依赖namenode内存大小,只有一个namenode节点对上层应用提供服务,内存压力和资源开销巨大。为了缓解这种压力,使其能够水平伸缩,引入hdfs联邦机制。实际上,hdfs联邦对已有的hdfs改动很小,大多是在datanode节点上做改动。
应用场景:
为外部应用独立的提供基于namenode/namespace的文件系统,各自之前互不影响,自行管理。其实就是多namenode,每个namenode对应一个外部应用提供服务。
机制:
通过namenode/namespace+block pool(内部自治)实现hdfs联邦。命名空间(namenode/namespace)管理着目录、文件、数据块,支持对数据文件的各种操作,如修改、删除、新建等操作,而块池则管理着数据库的存储,同样支持对数据库的各种操作。允许一个HDFS集群中存在多个NameNode同时对外提供服务,这些NameNode分管一部分目录(水平切分),每个namespace都有一个block pool,彼此之间相互隔离,但共享底层的DataNode存储资源。
优势:
1.支持namenode/namespace水平扩展,结构简单,向后兼容(不需要改动现有的namenode配置)。
2.性能,多namenode提高吞吐量。
3.隔离性,为不同的应用程序或用户分配不同的命名空间,便于管理和维护。
详情参见该博文:HDFS Federation
- 理解Hadoop分布式文件系统HDFS(二)
- 理解Hadoop分布式文件系统HDFS(一)
- Hadoop分布式文件系统(HDFS)
- Hadoop分布式文件系统(HDFS)
- Hadoop分布式文件系统(HDFS)
- 深入理解HDFS:Hadoop分布式文件系统
- Hadoop学习笔记(二)--HDFS分布式文件系统(1)
- hadoop知识点总结(二)hdfs分布式文件系统
- HDFS-hadoop分布式文件系统
- Hadoop HDFS分布式文件系统
- HDFS--Hadoop分布式文件系统
- HDFS--Hadoop分布式文件系统
- hdfs:Hadoop分布式文件系统
- HDFS【Hadoop分布式文件系统】
- Hadoop分布式文件系统HDFS
- 《Hadoop学习笔记系列》二.Hadoop分布式文件系统 HDFS
- Hadoop的分布式文件系统(HDFS)
- Hadoop分布式文件系统(HDFS)学习笔记
- sql 已知两点的经纬度,求距离
- 2015年工作报告与总结
- Python自动化查询CNKI并获取查询结果
- 手机相册的基本使用
- uva1398 - Meteor
- 理解Hadoop分布式文件系统HDFS(二)
- 【总结】深插浅出重拾Linux
- 为已有的web project项目加入maven支持,并使用myeclipse的插件.
- sp<> wp<>-Android中定义了两种智能指针强指针sp和弱指针wp
- RUST语法
- hdu3342 Legal or Not(简单拓扑排序判定)
- 圆形ImageView系列(一)-----Xfermode+View
- LightOJ--1149--Factors and Multiples(二分图好题)
- Android自定义属性限制