MapReduce点滴
来源:互联网 发布:数据库数据库系统 编辑:程序博客网 时间:2024/06/06 16:34
1、一个映射(Map)函数就是对一些独立元素组成的列表中的每一个元素进行指定的操作。类似于STL中的算法。Map操作是可以高度并行的,这对高性能要求的应用和并行计算领域非常有用。
2、化简(Reduce)操作指的是对一个列表的元素进行适当的合并(例如迭代求和)。
3、我们可以把MapReduce理解为,把一堆杂乱无章的数据按照某种特征归纳起来,然后处理并得到最后的结果。Map面对的是杂乱无章的互不相关的数据,它解析每个数据,从中提取出key和value,也就是提取了数据的特征。经过MapReduce的Shuffle阶段之后,在Reduce阶段看到的都是已经归纳好的数据了,在此基础上我们可以做进一步的处理以便得到结果。
摘自 http://my.oschina.net/lvzjane/blog/144555
0 0
- MapReduce点滴
- MapReduce“单机版”日志分析实践点滴
- 点滴
- 点滴
- 点滴
- 点滴
- 点滴
- 点滴
- 点滴
- 点滴
- 点滴
- 点滴
- 点滴
- 点滴
- 点滴
- 点滴
- 点滴
- 点滴
- linux下2048小游戏
- linux内存管理(堆栈、数组)
- 浏览器兼容性
- SQLite使用
- 集合框架1
- MapReduce点滴
- 数据流基本问题--独立元素计数(二)
- Android使用ActionBar和ViewPager切换页面
- Android 性能优化(六)——资源文件的存放
- excel 导入文本数据乱码问题
- 冒泡排序法
- xml转json
- Cannot instantiate the type HttpClient问题
- drf