程序博客网 > 周杰伦英雄知乎

hadoop之shuffle------>soft和combiner

来源：互联网发布：周杰伦英雄知乎编辑：程序博客网时间：2024/05/17 02:53

一、shuflle之soft

此处用一个具体的实例来说明soft机制

实例：

1. 需求
账号收入支出日期
zhangsan@163.com6000 0 2014-02-20
lisi@163.com 2000 0 2014-02-20
lisi@163.com 0 100 2014-02-20
zhangsan@163.com3000 0 2014-02-20
wangwu@126.com9000 0 2014-02-20
wangwu@126.com0 200 2014-02-20

将上述数据，按照收入由高到低排序，收入相同的按支出从低到高排序
结果实现

2.代码实现

要想获得完成的排序结果，需要分两步来写，第一步是正常的Mapper,Reducer,获得结果如下

第二步：

在map和reduce阶段进行排序时，比较的是k2。v2是不参与排序比较的。如果要想让v2也进行排序，需要把k2和v2组装成新的类，作为k2，才能参与比较。所以，如果想对上述结果进行排序，就要将Bean作为K2传入

注意：Bean实现WritableComparable接口

例如：
public class InfoBean implements WritableComparable<InfoBean>

在这个类中需要重写compareTo方法

二、shuflle之combiner

1. 作用：每一个map可能会产生大量的输出，combiner的作用就是在map端对输出先做一次合并，以减少传输到reducer的数据量。

2. 影响：如果不用combiner，那么，所有的结果都是reduce完成，效率会相对低下。使用combiner，先完成的map会在本地聚合，提升速度。

3.实质：Combiner是一个特殊的Reducer，继承Reducer类

4.使用：在main函数中设置combiner类即可

例如：wordcount类中

job.setCombinerClass(WCReducer.class);

5.对比：

（1）无combiner

(2)有combiner

可以发现，在Mapper端会先进行一个计算，然后再Reducer端再进行一次计算

0 0

周杰伦英雄知乎

周杰伦英雄知乎

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子左尺桡骨远端骨折尺骨骨不连尺骨茎突腱鞘炎尺骨鹰嘴位置图片尺骨骨折是几级伤残尼山哦尼哪尼希泊尼战纪欧尼酱什么意思盘尼西林马尔尼菲蓝状菌尼山圣境本尼迪克特康伯巴奇曼尼普尔布朗尼丹尼格林罗伯特德尼罗马尔尼菲菌雷尼替丁东尼东尼乔巴盐酸雷尼替丁胶囊杰克丹尼马尔尼菲罗宾尼别当欧尼酱尼布楚条约盐酸尼替丁胶囊雷尼替丁胶囊尼字组词尼的拼音尼组词尼怎么组词布莱尼泰罗尼亚罗马尼亚亚美尼亚加利福尼亚泽诺尼亚斯洛文尼亚爱沙尼亚