Flume采集数据到HDFS时,文件中有乱码

来源:互联网 发布:鹊桥 淘宝客 区别 编辑:程序博客网 时间:2024/05/02 01:59

参数

hdfs.fileType    

默认值

SequenceFile    

参数描述

File format: currently SequenceFile, DataStream or CompressedStream

(1)DataStream will not compress output file and please don’t set codeC

(2)CompressedStream requires set hdfs.codeC with an available codeC


翻看Flume文档,发现,HdfsEventSink中,hdfs.fileType默认为SequenceFile,将其改为DataStream就可以按照采集的文件原样输入到hdfs,加一行

a1.sinks.k1.hdfs.fileType=DataStream

0 0
原创粉丝点击