Hadoop之客户端读取HDFS中的数据
来源:互联网 发布:淘宝店怎么提高访客 编辑:程序博客网 时间:2024/06/06 02:45
客户端通过调用FileSystem对象的open()方法来打开希望读取的文件DistributedFileSystem使用RPC调用namenode,确定文件起始块位置。对于文件的每个块,namenode返回该块副本的datanode的地址,这些datanode根据与客户端的距离排序,如果客户端本身就是一个datanode,并且保存有副本时,则从本地datanode中读取数据。客户端使用DistributedFileSystem返回的FSDataInputStream流对象读取数据,客户端调用read方法,将数据从datanode传输到客户端,完成后寻找下一个块的最佳datanode。一旦客户端完成读取,FSDataInputStream调用close方法。注:如果流于datanode通信出现错误,他会尝试从这个块的另一个最近的datanode读取数据。
重点:数据流分散在集群中所有datanode,namenode告知客户端每个块最佳datanode。由客户端直接从该datanode读取数据。所以这种设计能够HDFS可扩展到大量并发客户端
2015年10月27日凌晨
0 0
- Hadoop之客户端读取HDFS中的数据
- Hadoop源码分析之客户端读取HDFS数据
- 客户端读取HDFS中的数据
- Hadoop源码分析之客户端向HDFS写数据
- hadoop源码解析之hdfs读取数据全流程分析
- HDFS 客户端 读取和写入 HDFS中的数据流程的简单理解
- 大数据之hadoop【hdfs】
- Hadoop之HDFS客户端------java实现
- Hadoop学习笔记之HDFS读取
- Hadoop学习之HDFS文件读取
- Hadoop之HDFS文件读取流程
- Hadoop之HDFS存储及读取机制
- hadoop源码解析之hdfs写数据全流程分析---客户端处理
- 读取客户端文本文件中的数据
- Hadoop 之 HDFS 的数据完整性
- 大数据Hadoop之HDFS和MapReduce_02_01
- 2-7HDFS读取数据过程(Hadoop系列day02)
- hadoop 从mysql中读取数据写到hdfs
- Nand flash uboot 命令详解
- 输入内容到指定文本中,并打开文件
- GetDC()没有释放造成的后果
- C++Primer第五版 12.1.3节练习
- qt移植到arm上的过程
- Hadoop之客户端读取HDFS中的数据
- git 免登录 文件
- Ubuntu(64bit)搭建Android测试环境
- 关于 @synchronized 理解
- 代理---代理---代理(这也把问题说清楚了,不过某些命名不是很规范)
- [FLUME-2052]Spooling directory source should be able to replace or ignore malformed characters
- Unity中简单 UI 管理类 - UIManager
- MPU6050 6DOF 数据读取
- ios开发实用快捷键