Apache Hadoop 2.0.5-alpha 相对前版本的改进

来源:互联网 发布:ubuntu 高分屏 dpi 编辑:程序博客网 时间:2024/05/17 03:15

 

Apache Hadoop 2.0.5-alpha  相比以前发布的稳定版本有了显著的改进。

下面是一个简短的概述,包含分布式文件系统(Hadoop Distributed File System)和MapReduce方面的改进。

 

HDFS 联合

 

        为了横向地测量命名服务的,federation采用多重独立的命名节点/命名空间

 

        这些命名节点是federated的,这意味着,这些命名节点是独立的,而且不要求与其他命名节点协同工作。数据节点作为块的公共存储器被所有命名节点使用。在cluster中,每一个数据节点被注册到所有的命名节点上。数据节点会定期发送心跳和块报告到命名节点,并处理来自命名节点的命令。

 

        更多详情,见 HDFS Federation 文档。

 

 

下一代MapReduce ,又称YERN,又称MRv2

 

         在hadoop-0.23中引入的新架构,把JobTracker的两大主要功能(资源管理和任务生命周期管理)分到了不同的组件中。

 

         新的资源管理者管理应用程序需要的全局计算机资源的分配,每个应用程序的主人管理着这个应用程序的调度和协调。

 

         一个应用程序要么是上一代MapReduce任务意义上的一个单独的任务,要么是一打这样的任务。

 

        一个资源管理者和每台机器的节点管理者守护进程,管理着那台机器上的用户进程,形成计算载体。

 

        每个应用程序的主人,实际上是一个特定的框架库,并负责与资管管理者交互且与节点管理者协同工作,执行和监控任务。

 

        更多详情,见YARN文档。

 

原英文文档:http://hadoop.apache.org/docs/r2.0.5-alpha/