Spark API 之 reduce、reduceByKey 、 mapvalues
来源:互联网 发布:淘宝论坛taoxiaobai 编辑:程序博客网 时间:2024/06/05 20:13
转:http://blog.csdn.net/guotong1988/article/details/50555185
reduce(binary_function)
reduce将RDD中元素前两个传给输入函数,产生一个新的return值,新产生的return值与RDD中下一个元素(第三个元素)组成两个元素,再被传给输入函数,直到最后只有一个值为止。
- 1
- 2
- 1
- 2
具体过程,RDD有1 2 3 4 5 6 7 8 9 10个元素,
1+2=3
3+3=6
6+4=10
10+5=15
15+6=21
21+7=28
28+8=36
36+9=45
45+10=55
reduceByKey(binary_function)
reduceByKey就是对元素为KV对的RDD中Key相同的元素的Value进行binary_function的reduce操作,因此,Key相同的多个元素的值被reduce为一个值,然后与原RDD中的Key组成一个新的KV对。
- 1
- 2
- 1
- 2
//结果 Array((1,5), (3,10))
mapValues(function)
原RDD中的Key保持不变,与新的Value一起组成新的RDD中的元素。因此,该函数只适用于元素为KV对的RDD。
- 1
- 2
- 3
- 1
- 2
- 3
//"x" + _ + "x"
等同于everyInput =>"x" + everyInput + "x"
//结果
Array(
(3,xdogx),
(5,xtigerx),
(4,xlionx),
(3,xcatx),
(7,xpantherx),
(5,xeaglex)
)
阅读全文
0 0
- Spark API 之 reduce、reduceByKey 、 mapvalues
- Spark API 详解/大白话解释 之 reduce、reduceByKey
- Spark API 详解/大白话解释 之 reduce、reduceByKey
- Spark算子[07]:reduce,reduceByKey,count,countByKey
- scala交互式操作 reduceByKey mapValues
- Spark代码3之Action:reduce,reduceByKey,sorted,lookup,take,saveAsTextFile
- Spark API 详解/大白话解释 之 map、mapPartitions、mapValues、mapWith、flatMap、flatMapWith、flatMapValues
- Spark API 详解/大白话解释 之 map、mapPartitions、mapValues、mapWith、flatMap、flatMapWith、flatMapValues
- Spark源码之reduceByKey与GroupByKey
- reduce 与 reduceByKey 区别
- Spark RDD API详解之Map和Reduce
- 【Spark Java API】Transformation(11)—reduceByKey、foldByKey
- Spark RDD---api(map&reduce)
- Spark编程的基本的算子之:combineByKey,reduceByKey,groupByKey
- [spark]groupbykey reducebykey
- spark ReduceByKey操作
- spark--transform算子--reduceByKey
- Spark RDD API详解Map和Reduce
- xlsx2string Excel配表解析工具
- [线段树] Codeforces 811E Round #416 (Div. 2) E. Vladik and Entertaining Flags
- 第十三天(封装 构造函数)
- 第二章——线性表
- 丑数II
- Spark API 之 reduce、reduceByKey 、 mapvalues
- bzoj 4777: [Usaco2017 Open]Switch Grass 线段树+最小生成树+set
- C语言中结构体的对齐规则
- Context都没弄明白,还怎么做Android开发?
- 动态SQL
- 有关字符编码的记录
- 黑盒测试方法(六)判定
- 合并两个排序数组
- javaee中request与response分不清以及请求转发