Hadoop学习笔记

来源:互联网 发布:九龙朝圣兽数据 编辑:程序博客网 时间:2024/05/20 06:39
Hadoop介绍 

Hadoop是Google云计算框架的开源实现,是一个分布式存储和分布式计算的框架,主要包括HDFS和MapReduce的实现。 

  HDFS 

HDFS由一个NameNode和多个DataNode组成,其中NameNode相当于系统的元数据存放地,它是Hadoop系统的神经中枢,而多个DataNode存储数据。 

MapReduce:分布式计算 

一个调用客户端由一个JobTracker代表,它将一个任务划分为多个子任务,每个子任务分别由一个TaskTracker负责。TaskTracker和DataNode在一起,本地数据本地计算。 
0 0
原创粉丝点击