Hadoop的Map-Shuffle-Reduce

来源:互联网 发布:衢州学院网络课程 编辑:程序博客网 时间:2024/05/18 03:11
一 本地优化——Combine

二 从Map到Reduce阶段
注意:一个MapReduce作业中,以下三者的数量总是相等的
在一个Reduce中,所有数据都会被按照key值升序排序,故如果part输出文件中包含key值,则这个文件一定是有序的。

三 Reduce任务数量

四 Reduce任务数量