读取hadoop Sequence格式的文件的代码
来源:互联网 发布:java 正则ip和端口号 编辑:程序博客网 时间:2024/06/11 03:14
http://blog.csdn.net/longerandlonger/article/details/8482477
- public static void main(String[] args) {
- org.apache.hadoop.io.SequenceFile.Reader reader = null;
- java.io.FileOutputStream fos = null;
- try {
- String uri = "file:///D:/attempt_201212181734_2923950_r_000000_0";
- org.apache.hadoop.conf.Configuration conf = new org.apache.hadoop.conf.Configuration();
- FileSystem fs = FileSystem.get(conf);
- Path path = new Path(uri);
- reader = new org.apache.hadoop.io.SequenceFile.Reader(fs, path, conf);
- Writable key = (Writable) org.apache.hadoop.util.ReflectionUtils.newInstance(reader.getKeyClass(), conf);
- Writable value = (Writable) org.apache.hadoop.util.ReflectionUtils.newInstance(reader.getValueClass(), conf);
- int n=0;
- while(reader.next(key, value)){
- /* 如果解析出是乱码,尝试用户UTF8转码 */
- //String valueStr = new String(value.toString().getBytes("ISO8859_1"),"GB2312");
- System.out.println(value.toString());
- }
- } catch (Exception e) {
- e.printStackTrace();
- } finally {
- IOUtils.closeStream(reader);
- IOUtils.closeStream(fos);
- }
- }
0 0
- 我的读取hadoop Sequence格式的文件的代码
- 读取hadoop Sequence格式的文件的代码
- hadoop读取 Sequence格式的文件的代码
- spark 读取hadoop 格式的文件
- Hadoop Sequence File 文件的读取和写入
- Hadoop Sequence File 文件的读取和写入
- hadoop用mutipleInputs实现map读取不同格式的文件
- hadoop单机模式读取sequence文件
- hadoop mapreduce模式读取sequence文件
- Hadoop的整文件读取
- 读取pbxproj格式的文件
- 读取其他格式的文件
- 读取文件的代码
- 如何让Hadoop读取以gz结尾的文本格式的文件
- Hadoop如何读取复杂格式的文件,例如XML、HTML、图像等,附源码
- hadoop用MultipleInputs/MultiInputFormat实现一个mapreduce job中读取不同格式的文件
- Hadoop的sequence File
- 读取xml格式的天气预报的代码
- 在C++ 程序中调用被C 编译器编译后的函数,为什么要加extern “C”?----转
- Eclipse:Error:could not find java SE Runtime Environment/Error: could not find java.dll
- 最常用的git命令
- dllmain简介
- android安卓源码下载
- 读取hadoop Sequence格式的文件的代码
- Kafka Topic动态迁移 (源代码解析)
- 泛型算法find和find_if以及sort
- 一张图告诉你Java命名规范
- [Leetcode]Search for a Range
- android蓝牙开发
- 输出四个数字字符
- AndroidAnnotation在Eclipse环境下部署android 项目
- HTML <meta> 标签