MapReduce的运行原理

来源:互联网 发布:软件版本升级说明 编辑:程序博客网 时间:2024/05/16 04:57

基本原理:分而治之.一个任务分成多个子任务(map),并行处理后,合并(reduce)结果.

例子:统计日志文件中,访问量最多的ip.

1.按时间把记录分成5份,由5个任务进行统计.(map)
2.每个任务统计出其记录中不同ip对应的访问量.
3.5个任务把各自结果进行合并,可以得到(reduce)不同ip的访问量
4.得到结果

这里写图片描述

0 0