Hadoop权威指南读书笔记(第三章Hadoop分布式文件系统)
来源:互联网 发布:js json对象按key排序 编辑:程序博客网 时间:2024/04/29 04:52
HDFS的设计建立在这样一个思想上:一次写入、多次读取是最高效的
HDFS中fsck指令会显示块的信息:% hadoop fsck / -files -blocks
HDFS中的名称节点与数据节点
HDFS集群有两种节点:一个名称节点(管理者)和多个数据节点(工作者) 注:没有名称节点 文件系统将无法使用
基本文件系统操作:
1 -copyFromLocal 将本地文件copy到localhost上的HDFS中
2 -copyToLocal 将HDFS中的文件copy到本地
3 查看HDFS文件列表的命令:% hadoop fs -ls .
HDFS中的JAVA接口:
1 从Hadoop URL中读取数据
public class URLCat { static { URL.setURLStreamHandlerFactory(new FsUrlStreamHandlerFactory()); } public static void main(String[] args) throws Exception { InputStream in = null; try { in = new URL(args[0]).openStream(); IOUtils.copyBytes(in, System.out, 4096, false); } finally { IOUtils.closeStream(in); } }}
上述方法中的setURLStreamHandlerFactory在JVM中只能调用一次。
2 使用FileSystem API 读取数据
public class FileSystemCat { public static void main(String[] args) throws Exception { String uri = args[0]; Configuration conf = new Configuration(); FileSystem fs = FileSystem.get(URI.create(uri), conf); InputStream in = null; try { in = fs.open(new Path(uri)); IOUtils.copyBytes(in, System.out, 4096, false); } finally { IOUtils.closeStream(in); } }}
0 0
- Hadoop权威指南读书笔记(第三章Hadoop分布式文件系统)
- 【Hadoop权威指南】Hadoop分布式文件系统
- 《Hadoop权威指南》- 3、Hadoop 分布式文件系统
- 《hadoop 权威指南》 学习笔记(2)Hadoop 分布式文件系统
- 【Hadoop权威指南】Hadoop分布式文件系统(第三天)
- 《hadoop权威指南》学习笔记-hadoop分布式文件系统
- 《Hadoop权威指南》——3、Hadoop 分布式文件系统
- 《hadoop 权威指南》 读书笔记
- 《hadoop 权威指南》 读书笔记
- Hadoop权威指南-读书笔记
- Hadoop权威指南读书笔记
- 第三章 hadoop分布式文件系统
- 第三章 Hadoop分布式文件系统
- hadoop 权威指南 2、3章读书笔记
- Hadoop权威指南读书笔记(更新中)
- Hadoop权威指南 第三章笔记
- Hadoop权威指南第三章笔记
- hadoop 权威指南【第三版】
- android调节声音大小
- Java 语言的类、属性、方法各有哪些修饰符?简述各修饰符的区别
- 获取Windows系统特殊性目录路径
- Unable to find module with Gradle path. Linking to library -unspecified instead
- python中 try、except、finally 的执行顺序
- Hadoop权威指南读书笔记(第三章Hadoop分布式文件系统)
- 【学习笔记】HTML的基本语法(二)
- 百度云,无限制下载速度的方法
- Java SDK jar的使用
- 两分钟明白 Android Activity生命周期
- OC_02循环语句
- APN推送通知踩过的坑
- javascript自适应宽度的瀑布流
- 【学习】java参数传递