HDFS总结

来源：互联网发布：东方不败知夫君是死神编辑：程序博客网时间：2024/06/08 17:42

本文以如下两个方面展开：HDFS的组成，HDFS的各组成的工作方式也就是HDFS的功能是怎样实现的

一、HDFS是什么

HDFS(Hadoop Distributed File System)，是Apache基金会下的项目Hadoop的一个主要组成部分。Hadoop的另一个主要组成部分是MapReduce，作者受到谷歌的论文GFS的启发而设计出的一个分布式文件存储系统。它和MapReduce一起组成了Hadoop，其中，HDFS负责海量数据的存储，MapReduce负责海量数据的计算。

二、HDFS的组成

（1）Namenode 元数据结点

一个HDFS的Namenode只有一台，它并不真正存储数据，而是存储元数据，什么是元数据呢？简单来讲，数据是分成很多个数据块（block）存放在分布式文件系统的不同的Datanode上，而元数据就记录了这个文件在文件系统的哪些节点上，副本在哪些节点上等等的映射信息。客户端进行读写首先是通过Namenode的。

（2）Datanode 数据节点

一个HDFS通常具有很多台Datanode，它们是文件真正存放的地方。文件经过切分之后写入到多台Datanode，切分工作由客户端完成，每个文件块（block）写入成功一次之后，由Datanode通过网络继续往下分发，直到达到系统要求的副本数。假如在某个文件块拷贝过程中失败了，被拷贝文件块所在的节点收不到拷贝成功的信号，就会将情况上报给Namenode，Datanode就再安排某一个节点接收这个文件块的拷贝。

（3）Secondary Namenode 从元数据节点

从元数据节点，不是Namenode的备份。它有另外的功能，它的功能要配合Namenode的工作方式进行工作，下文将会详细叙述。