mapreduce中的压缩
来源:互联网 发布:linux lvm配置文件 编辑:程序博客网 时间:2024/05/18 06:23
转载请注明出处:http://blog.csdn.net/lastsweetop/article/details/9187721
作为输入
当压缩文件做为mapreduce的输入时,mapreduce将自动通过扩展名找到相应的codec对其解压。
作为输出
当mapreduce的输出文件需要压缩时,可以更改mapred.output.compress为true,mapped.output.compression.codec为想要使用的codec的类名就
可以了,当然你可以在代码中指定,通过调用FileOutputFormat的静态方法去设置这两个属性,我们来看代码:
- package com.sweetop.styhadoop;
- import org.apache.hadoop.fs.Path;
- import org.apache.hadoop.io.IntWritable;
- import org.apache.hadoop.io.Text;
- import org.apache.hadoop.io.compress.GzipCodec;
- import org.apache.hadoop.mapreduce.Job;
- import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
- import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
- import java.io.IOException;
- /**
- * Created with IntelliJ IDEA.
- * User: lastsweetop
- * Date: 16-6-27
- * Time: 下午7:48
- * To change this template use File | Settings | File Templates.
- */
- public class MaxTemperatureWithCompression {
- public static void main(String[] args) throws Exception {
- if (args.length!=2){
- System.out.println("Usage: MaxTemperature <input path> <out path>");
- System.exit(-1);
- }
- Job job=new Job();
- job.setJarByClass(MaxTemperature.class);
- job.setJobName("Max Temperature");
- FileInputFormat.addInputPath(job, new Path(args[0]));
- FileOutputFormat.setOutputPath(job, new Path(args[1]));
- job.setMapperClass(MaxTemperatrueMapper.class);
- job.setCombinerClass(MaxTemperatureReducer.class);
- job.setReducerClass(MaxTemperatureReducer.class);
- job.setOutputKeyClass(Text.class);
- job.setOutputValueClass(IntWritable.class);
- FileOutputFormat.setCompressOutput(job, true);
- FileOutputFormat.setOutputCompressorClass(job, GzipCodec.class);
- System.exit(job.waitForCompletion(true)?0:1);
- }
- }
0 0
- Hadoop MapReduce中的压缩
- mapreduce中的压缩
- mapreduce 压缩
- mapreduce 压缩
- hadoop深入研究:(九)——mapreduce中的压缩
- hadoop深入研究:(九)——mapreduce中的压缩
- hadoop深入研究:(九)——mapreduce中的压缩
- hadoop深入研究:(九)——mapreduce中的压缩
- MapReduce计算过程中的压缩和效率的对比问题
- hadoop mapreduce中压缩
- MapReduce输出压缩格式文件
- 设置mapreduce压缩输出
- 在mapreduce中使用压缩
- mapreduce简单的gzip压缩
- mapreduce程序的压缩实现
- 在MapReduce中使用压缩
- MR-4.MapReduce使用压缩
- MapReduce中的排序
- Centos6.6部署Mysql+nginx+php环境
- java 开发设计 小游戏 英雄 怪物 武器 关键代码
- [置顶] 修正FLEA_Helper_Pager,让其支持source为sql时的多数据库操作
- 音乐播放记录查询
- [置顶] FLEAPHP 数据库查询 in 的用法
- mapreduce中的压缩
- [置顶] 自定义类自动加载类
- http接口请求参数签名工具类的实现和测试代码
- ListView中getView()的原理
- R 画图之ggplot(1)
- Web 开发工具类(5) | DateUtils
- [置顶] 写个日志封装器....感觉用起来很爽
- vs2013 项目属性配置的总结(主要用于opencv不同版本的管理)
- [置顶] orm 用多了,忽然发觉SQL不会写了... 整个基本的功能重新学习SQL,改自fleaphp