Hadoop 的lzo压缩尝试

来源:互联网 发布:自动下单软件 编辑:程序博客网 时间:2024/05/17 09:10

具体设置见那两个网页,一个是hadoop-gpl-compression 的wiki,一个是[hadoop系列]hadoop-gpl-compression的安装和编译

切记要

<property>
<name>mapred.compress.map.output</name>
<value>true</value>
</property>

<property>
<name>mapred.map.output.compression.codec</name>
<value>com.hadoop.compression.lzo.LzoCodec</value>
</property>

 

用了lzo压缩之后,由平均4:15左右降低到3:50左右。依然是4G的PageRank。

 

原创粉丝点击