Hadoop简介

来源:互联网 发布:avision扫描仪软件 编辑:程序博客网 时间:2024/06/18 08:05

1.Hadoop是Apache软件基金会旗下的一个开源分布式存储与计算平台。

 

2.Hadoop是以Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)和MapReduce(Google MapReduce的开源实现)为核心的,为用户提供了底层细节透明的分布式基础架构。

 

3.Hadoop架构特点

          a)采用分布式存储方式来提高读写速度和扩大存储容量

          b)采用MapReduce整合分布式文件系统上的数据,保证高速分析处理数据

          c)采用存储冗余数据来保证数据的安全性

总之,Hadoop中HDFS的数据管理能力、MapReduce处理任务时的高效率以及它的开源特性,使其在同类分布式系统中大放异彩,并在众多行业和科研领域中被广泛应用。

 

4.Hadoop集群运行时的进程

           ——》NameNode
           ——》SecondaryNameNode
           ——》DataNode
           ——》JobTracker

           ——》TaskTracker
0 0
原创粉丝点击