程序博客网 > 淘宝优站九块九包邮

Hadoop学习之HDFS写流程

来源：互联网发布：淘宝优站九块九包邮编辑：程序博客网时间：2024/05/16 00:53

HDFS写流程图
这里写图片描述

假设有个bigdata.log文件需要上传到HDFS系统根目录，使用以下命令

hadoop fs -put bigdata.log /

整个写流程如下
1、客户端会调用DistributedFileSystem对象的create（）方法，与NameNode进行RCP通信。

2、NameNode接收到用户的写文件的RPC请求后，首先进行各种检查。如用户是否有创建权限和该文件是否已存在，检查通过后才会创建一个文件，并将操作记录到editlog中，然后DistributedFileSystem会将DFSOutputStream对象包装在FSDataOutStream实例中，返回客户端；否则文件创建失败并且给客户端抛IOException

3、客户端会开始写文件，FSOutputStream会将文件进行切块。然后向NameNode请求适合存放文件块的DataNode列表，然后这些DataNode会生成一个数据流管道，我们假设副本集参数被设置为3，那么这个数据流管道中就有三个DataNode节点。

4、首先FSOutputStream会将文件块向数据流管道中的第一个DataNode节点写数据，第一个DataNode接收文件块后会把文件块写向数据流管道中的第二个节点，同理，第二个节点接收保存数据块后会将数据块写向数据流管道中的第三个DataNode节点

5、当第三各DataNode节点数据库写入成功后，会向第二个DataNode节点发送数据写入成功的确认消息，第二个DataNode节点收到第三个的确认消息后会向第一个DataNode节点发送数据写入成功的确认消息。当三个节点都确认数据写入成功后DataNode会向FSOutputStream对象发送ack packets，最后会调用对象的close（）方法。

注：假如客户端就是集群中某一个DataNode节点，那么第一个数据块会优先存储在本DataNode节点上。

阅读全文

0 0

淘宝优站九块九包邮

淘宝优站九块九包邮

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子卡里 wwe卡里 sim卡里的联系人怎么导入手机狂野角斗士巨人卡里卡针卡针怎么用手机取卡针手机卡针取卡针可以用什么代替取卡针怎么用手机卡针怎么用取卡针取卡针怎么用图解手机取卡针可以用什么代替取卡器没卡针怎么把卡取出来卡针怎么取卡手机取卡针怎么用卡钳卡钳品牌刹车卡钳卡钳是什么汽车卡钳卡钳喷漆刹车卡钳异响刹车卡钳喷漆多少钱汽车卡钳喷漆危害卡钳喷漆多少钱 ap刹车卡钳 brembo刹车卡钳红色卡钳汽车卡钳是什么卡钳图片卡钻卡钻卡盟卡钻软件卡铂卡铂吊顶卡铂与顺铂的区别卡铂价格卡铂说明书