Hadoop的sequence File

来源:互联网 发布:中国税务网络大学首页 编辑:程序博客网 时间:2024/05/29 17:38

第一次写自定义类型的sequence File。

发现必须继承两个文件一个是sequenceFileinputformat,一个是sequenceFileRecordReader。

发现虽然Hadoop中有arraywritable类型,但是很难使用。

无论是哪种inputformat,其读取key/value对时,无论是以byte[],还是String ,都无法将value还原回array。

如果用object,还是会降低效率。

最好都用Text.

原创粉丝点击