笔记:Hadoop权威指南 第3章 HDFS
来源:互联网 发布:网络接线盒 编辑:程序博客网 时间:2024/06/05 02:31
一、适合 HDFS 的场合
1、超大文件:几百MB、几百GB、几百TB、PB
2、流式访问:一次写入,多次访问
3、商用硬件:不昂贵,可以容忍故障
二、不适合HDFS的场合
1、低时间延迟的数据访问 (可以用HBase)
2、大量的小文件:将耗尽NameNode 的内存
3、多用户写入,任意修改文件
三、HDFS 概念
1、块:默认64M 大小,好处:可以最小化寻址时间;文件容量可以大于磁盘容量;简化存储子系统,适用于存储。
2、NameNode:管理文件系统的命名空间,包括命名空间镜像文件fsimage、编辑日志文件 edits。丢失NameNode,整个文件系统将无法使用。
3、DateNode:存储并检索数据块,向Namenode 发送文件裂变
4、NameNode 容错保证:备份NameNode 元数据;在hadoop2 中运行StandBy NameNode,保证HA。
四、HDFS操作
1、通过命令行借口:put get ls rm cat mkdir 等。
2、通过 FileSystem API:
Configuration conf = new Configuration()String uri = "hdfs://10.1.1.1:9000/user/admin/content.txt" FileSystem fs = FileSystem.get(URI.create(uri), conf); InputStream in = fs.open(new Path(uri));
可支持随机访问
五、HDFS 的数据流
1、文件读取
2、文件写入
0 0
- 笔记:Hadoop权威指南 第3章 HDFS
- hadoop权威指南笔记-hdfs-1
- Hadoop权威指南笔记①(HDFS,MR)
- 笔记:Hadoop权威指南 第1章 初识Hadoop
- 笔记:Hadoop权威指南 第4章 Hadoop I/O
- 笔记:Hadoop权威指南 第9章 构建Hadoop集群
- 笔记:Hadoop权威指南 第10章 管理Hadoop
- 笔记:Hadoop权威指南 第2章 关于MapReduce
- 笔记:Hadoop权威指南 第5章 MapReduce 应用程序开发
- 笔记:Hadoop权威指南 第8章 MapReduce 的特性
- hadoop权威指南 之 HDFS
- Hadoop权威指南-HDFS概述
- Hadoop权威指南笔记
- hadoop权威指南第二章笔记
- Hadoop权威指南 第三章笔记
- hadoop权威指南第一第二章笔记
- Hadoop权威指南第三章笔记
- Hadoop权威指南第九章笔记
- SIFT 特征提取算法总结
- 本地开发spark代码上传spark集群服务并运行(基于spark官网文档)
- java解惑之字符之谜(谜题14)
- android handler的警告Handler Class Should be Static or Leaks Occur
- jQuery 动态绑定的方法多次执行的解决jQuery(document).on(
- 笔记:Hadoop权威指南 第3章 HDFS
- 工作日志
- Android相关问题的好文章整理——温故而知新,可以为师矣
- Tachyon 的 安装部署
- hdu 2153 仙人球的残影新解法(可以利用蛇阵来解决哦!)
- 安装SQL server出现“启用windows功能NetFx3”错误
- Appium中部分api的使用方法
- hdu4509 湫湫系列故事——减肥记II (离散化思想)
- OJ数组之在一组从小到大的数列中插入一个数后的重新排序