Hadoop中常用的InputFormat,OutPutFormat类
来源:互联网 发布:做淘宝客服有前途吗 编辑:程序博客网 时间:2024/05/16 12:32
Hadoop常用的INPUTFORMAT类,下表中列出来InputFormat的其他常用实现,并简要描述了每个实现传递给mapper的键/值对.
TestInputFormat
在文本文件中的每一行均为一个记录.键(key)为一行的字符偏移,而值(value)为一行的内容
Key:LongWritable
Value:Text
KeyValueTextinputFormat
在文本文件中的每一行均为一个记录.以每行的第一个分隔符为界,分隔符之前的是键(key),之后的是值(value).分离器在属性key.value.separator.in.input.line中设定,默认为制表符(\t)
Key:Text
Value:Text
SequenceFileInputFormat<K,V>
用于读取序列文件的InputFormat,键和值由用户定义,序列文件为Hadoop专用的压缩二进制文件格式.它专用于一个MapReduce作业和其他MapReduce作业之间传送数据
Key:K(用户定义)
Value:V(用户定义)
NLineInputFormat
与 TestInputFormat相同,但每个分片一定有N行,
N在属性mapred.line.input.format.inespermap中设定,默认为1.
Key:LongWritable
Value:Text
TextOutputFormat将每个记录写为一行文本,键和值以字符串的形式写入.并以制表符(\t)分隔,这个分隔符可以在属性mapred.textoutputformat.separator中修改.SequenceFileOutputFormat<K,V>以hadoop专有序列文件格式写入键/值对.与SequenceFileInputFormat配合使用nullOutputFormat<K,V>无输出
- Hadoop中常用的InputFormat,OutPutFormat类
- Hadoop中常用的InputFormat、OutputFormat
- Hadoop中常用的InputFormat、OutputFormat(转)
- Hadoop中常用的InputFormat、OutputFormat(转)
- Hadoop中常用的InputFormat、OutputFormat(转)
- Hadoop开发常用的InputFormat和OutputFormat
- Hadoop开发常用的InputFormat和OutputFormat
- Hadoop开发常用的InputFormat和OutputFormat
- Hadoop开发常用的InputFormat和OutputFormat
- Hadoop开发常用的InputFormat和OutputFormat
- Hadoop开发常用的InputFormat和OutputFormat
- Hadoop开发常用的InputFormat和OutputFormat
- Hadoop开发常用的InputFormat和OutputFormat
- Hadoop的InputFormat和OutputFormat
- Hadoop:InputFormat和OutputFormat
- 在Hadoop的streaming中使用自定义的inputformat和outputformat
- 在Hadoop的streaming中使用自定义的inputformat和outputformat
- hadoop 自定义inputformat和outputformat
- Oracle创建视图的语法 <转>
- Oracle重复数据的清除 <转>
- Oracle11gR2 在 Linux CentOS 5.3,RHEL 5.4 上的安装 <转>
- 母亲<曾卓>
- 对hadoop第一个小程序WordCount的简单解释.
- Hadoop中常用的InputFormat,OutPutFormat类
- Hadoop 中的 MapReduce链接作业之预处理和后处理阶段的链接
- Eclipse C/C++开发环境搭建(转)
- Java简单的数据类型
- ORACLE笔记
- 精确表达浮点数
- Hadoop 三台主机 集群搭建 详解 <转>
- Linux文件目录结构说明
- Linux笔记大杂烩