Hadoop,Spark :文件输出压缩

来源:互联网 发布:数字油画淘宝 编辑:程序博客网 时间:2024/06/05 01:17

Spark最终结果压缩

sparkContext.textFile(inputPath).flatMap(x => {    TestLog.readFromString(x)}).saveAsTextFile(outputPath, classOf[GzipCodec])
  • 1
  • 2
  • 3

MapReduce最终结果的压缩

FileOutputFormat.setCompressOutput(job, true);//设置压缩FileOutputFormat.setOutputCompressorClass(job, GzipCodec.class);//压缩类型
  • 1
  • 2

Mapper 中间结果压缩

Configuration conf = new Configuration();conf.setBoolean("mapred.compress.map.output",true);conf.setClass("mapred.map.output.compression.codec",GzipCodec.class,CompressionCodec.class);
原创粉丝点击