分布式计算开源框架Hadoop学习心得3
来源:互联网 发布:淘宝商家资质中心 编辑:程序博客网 时间:2024/04/30 14:39
图2:HDFS结构示意图
上图中展现了整个HDFS三个重要角色:NameNode、DataNode和Client。NameNode可以看作是分布式文件系统中的管理者,主要负责管理文件系统的命名空间、集群配置信息和存储块的复制等。NameNode会将文件系统的Meta-data存储在内存中,这些信息主要包括了文件信息、每一个文件对应的文件块的信息和每一个文件块在DataNode的信息等。DataNode是文件存储的基本单元,它将Block存储在本地文件系统中,保存了Block的Meta-data,同时周期性地将所有存在的Block信息发送给NameNode。Client就是需要获取分布式文件系统文件的应用程序。这里通过三个操作来说明他们之间的交互关系。
文件写入:
- Client向NameNode发起文件写入的请求。
- NameNode根据文件大小和文件块配置情况,返回给Client它所管理部分DataNode的信息。
- Client将文件划分为多个Block,根据DataNode的地址信息,按顺序写入到每一个DataNode块中。
文件读取:
- Client向NameNode发起文件读取的请求。
- NameNode返回文件存储的DataNode的信息。
- Client读取文件信息。
文件Block复制:
- NameNode发现部分文件的Block不符合最小复制数或者部分DataNode失效。
- 通知DataNode相互复制Block。
- DataNode开始直接相互复制。
- 分布式计算开源框架Hadoop学习心得3
- 分布式计算开源框架Hadoop学习心得之1
- 分布式计算开源框架Hadoop学习心得2
- 分布式计算开源框架Hadoop介绍
- 分布式计算开源框架Hadoop介绍
- 分布式计算开源框架Hadoop介绍
- 分布式计算开源框架Hadoop介绍
- 分布式计算开源框架Hadoop介绍
- 分布式计算开源框架Hadoop简介
- 分布式计算开源框架Hadoop介绍
- 分布式计算开源框架Hadoop介绍
- 分布式计算开源框架Hadoop介绍
- 分布式计算开源框架Hadoop介绍
- 分布式计算开源框架Hadoop
- 分布式计算开源框架Hadoop介绍
- 分布式计算开源框架Hadoop介绍
- 分布式计算开源框架Hadoop介绍
- 分布式计算开源框架Hadoop介绍
- 如何为一个网页中的frameset里两个frame中间添加一个伸缩条
- Windows服务编写原理及探讨
- 分布式计算开源框架Hadoop学习心得2
- 7.5日志
- 物理映像寄存器 西门子
- 分布式计算开源框架Hadoop学习心得3
- 又是德国
- IOCP实现步骤
- 编码习惯——小错误大问题
- 数据库设计:需求分析
- H.264视频的RTP荷载格式
- Linux下用Makefile自动生成依赖关系
- 为应用程序池“DefaultAppPool”提供服务的进程关闭时间
- HDU 2923 Einbahnstrasse