MapReduce点滴

来源:互联网 发布:数据库数据库系统 编辑:程序博客网 时间:2024/06/06 16:34

1、一个映射(Map)函数就是对一些独立元素组成的列表中的每一个元素进行指定的操作。类似于STL中的算法。Map操作是可以高度并行的,这对高性能要求的应用和并行计算领域非常有用。

2、化简(Reduce)操作指的是对一个列表的元素进行适当的合并(例如迭代求和)。

3、我们可以把MapReduce理解为,把一堆杂乱无章的数据按照某种特征归纳起来,然后处理并得到最后的结果。Map面对的是杂乱无章的互不相关的数据,它解析每个数据,从中提取出key和value,也就是提取了数据的特征。经过MapReduce的Shuffle阶段之后,在Reduce阶段看到的都是已经归纳好的数据了,在此基础上我们可以做进一步的处理以便得到结果。

摘自 http://my.oschina.net/lvzjane/blog/144555

0 0
原创粉丝点击