Hadoop,Spark[一]:文件输出压缩
来源:互联网 发布:mac系统升级安装失败 编辑:程序博客网 时间:2024/06/04 20:13
Hadoop,Spark[一]:文件输出压缩
在日常开发中,经常需要将最终的输出结果压缩,提升存储效率,为了日后开发方便,在这里记下常用的压缩。
Spark最终结果压缩
sparkContext.textFile(inputPath).flatMap(x => { TestLog.readFromString(x)}).saveAsTextFile(outputPath, classOf[GzipCodec])
MapReduce最终结果的压缩
FileOutputFormat.setCompressOutput(job, true);//设置压缩FileOutputFormat.setOutputCompressorClass(job, GzipCodec.class);//压缩类型
Mapper 中间结果压缩
Configuration conf = new Configuration();conf.setBoolean("mapred.compress.map.output",true);conf.setClass("mapred.map.output.compression.codec",GzipCodec.class,CompressionCodec.class);
阅读全文
0 0
- Hadoop,Spark[一]:文件输出压缩
- Hadoop,Spark :文件输出压缩
- spark & 文件压缩
- hadoop的文件压缩
- Hadoop文件压缩
- hadoop文件压缩格式
- hadoop 实现文件压缩
- spark多文件输出
- spark 加载多个目录; RDD输出到hdfs文件压缩
- Hadoop多文件输出:MultipleOutputFormat和MultipleOutputs深究(一)
- Hadoop多文件输出:MultipleOutputFormat和MultipleOutputs深究(一)
- Hadoop多文件输出:MultipleOutputFormat和MultipleOutputs深究(一)
- Hadoop多文件输出:MultipleOutputFormat和MultipleOutputs深究(一)
- Hadoop多文件输出:MultipleOutputFormat和MultipleOutputs深究(一)
- spark 输出结果压缩(gz)
- spark 输出结果压缩(gz)
- hadoop多文件输出
- hadoop多文件输出
- js中输入数字自动货币格式化
- C++中函数指针与回调函数
- ssh免密码登录配置详解
- [FAQ10400]如何在小部件列表中隐藏某个widget或者shortcut?
- 小波阀值去噪法基础
- Hadoop,Spark[一]:文件输出压缩
- 129. Sum Root to Leaf Numbers
- 二分查找法
- SQL注入思路分析(入门必看)
- 浅谈程序员该具备的自我修养
- MsgBox 常用语句
- Jenkins+Coding+Xcode+fir搭了一个持续集成环境
- 但愿人长久,千里共婵娟---众智云
- 【CodeForces】616C