程序博客网 > 头颅移植手术知乎

hadoop学习笔记--hadoop读写文件过程

来源：互联网发布：头颅移植手术知乎编辑：程序博客网时间：2024/05/23 00:08

读取文件：

下图是HDFS读取文件的流程：

这里是详细解释：

1.当客户端开始读取一个文件时，首先客户端从NameNode取得这个文件的前几个block的DataNode信息。（步骤1,2）

2.开始调用read()，read()方法里，首先去读取第一次从NameNode取得的几个Block，当读取完成后，再去NameNode拿下一批Block的DataNode信息。（步骤3,4,5）

3. 调用Close方法完成读取。（步骤6）

当读取一个Block时如果出错了怎么办呢。客户端会去另一个最佳的DataNode上读取这个块，并通知NameNode。

这么一系列复杂的过程对客户端都是透明的。客户端只知道源源不断的从Stream中读取数据。

写入文件：

1. 首先客户端高速NameNode:”我要创建一个文件”。NameNode会进行一系列检查，比如文件是否存在。一旦通过检查，则创建一个文件。这时候客户端就可以写入数据了。（步骤1，2）

2. 客户端在开始写入数据时，会把数据分片，然后放入一个队列。然后NameNode会分配一个DataNode的列表给客户端来写入数据。上图中是三个，也就是数据冗余三份。数据冗余的复制是在DataNode之间完成的。（步骤3,4,5）

3. 当客户端收到全部写入成功的回执（ack packet）之后，这时会把队列中上一个Block的数据删掉。然后进行下一个Block的写入。

1 0

头颅移植手术知乎

头颅移植手术知乎

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子告笔顺处笔顺将字的笔顺友笔顺部笔顺和笔顺为的繁体会字繁体将的繁体字以的繁体字会的繁体字所的繁体字中繁体字时的繁体字词的繁体字为组词为的组词为怎么组词为多音字怎么组词为字组词大全用为组词为的读音及组词多音字为组词为四声组词为字的多音字组词为的多音字组词 wei为四声怎么组词多音字为的读音及组词为的组词是什么为的多音字组词和拼音为字多音字组词和拼音为组词有哪些为的组词大全为的多音字组词和拼音怎么写为的组词有那些剩组词第组词知的组词为读音为的读音为富不仁读音