Spark API 详解/大白话解释 之 groupBy、groupByKey
来源:互联网 发布:java变量的主要类型 编辑:程序博客网 时间:2024/06/05 22:53
groupBy(function)
function返回key,传入的RDD的各个元素根据这个key进行分组
val a = sc.parallelize(1 to 9, 3)a.groupBy(x => { if (x % 2 == 0) "even" else "odd" }).collect//分成两组/*结果 Array((even,ArrayBuffer(2, 4, 6, 8)),(odd,ArrayBuffer(1, 3, 5, 7, 9)))*/
val a = sc.parallelize(1 to 9, 3)def myfunc(a: Int) : Int ={ a % 2//分成两组}a.groupBy(myfunc).collect
/*
结果
Array(
(0,ArrayBuffer(2, 4, 6, 8)),
(1,ArrayBuffer(1, 3, 5, 7, 9))
)
*/
groupByKey( )
val a = sc.parallelize(List("dog", "tiger", "lion", "cat", "spider", "eagle"), 2)val b = a.keyBy(_.length)//给value加上key,key为对应string的长度b.groupByKey.collect//结果 Array((4,ArrayBuffer(lion)), (6,ArrayBuffer(spider)), (3,ArrayBuffer(dog, cat)), (5,ArrayBuffer(tiger, eagle)))
0 0
- Spark API 详解/大白话解释 之 groupBy、groupByKey
- Spark API 详解/大白话解释 之 groupBy、groupByKey
- Spark API 详解/大白话解释 之 RDD、partition、count、collect
- Spark API 详解/大白话解释 之 reduce、reduceByKey
- Spark API 详解/大白话解释 之 reduce、reduceByKey
- Spark API 详解/大白话解释 之 map、mapPartitions、mapValues、mapWith、flatMap、flatMapWith、flatMapValues
- Spark API 详解/大白话解释 之 map、mapPartitions、mapValues、mapWith、flatMap、flatMapWith、flatMapValues
- Spark编程之基本的RDD算子之cogroup,groupBy,groupByKey
- Spark源码之reduceByKey与GroupByKey
- 【Spark Java API】Transformation(10)—combineByKey、groupByKey
- Spark算子[12]:groupByKey、cogroup、join、lookup 源码实例详解
- Spark编程的基本的算子之:combineByKey,reduceByKey,groupByKey
- [spark]groupbykey reducebykey
- spark groupByKey操作
- spark--transform算子--groupByKey
- Spark RDD/Core 编程 API入门系列之map、filter、textFile、cache、对Job输出结果进行升和降序、union、groupByKey、join、reduce、look
- Spark RDD/Core 编程 API入门系列 之rdd案例(map、filter、flatMap、groupByKey、reduceByKey、join、cogroupy等)(四)
- Spark RDD中Transformation的groupBy、partitionBy、cogroup详解
- appium自动化测试环境搭建和demo测试(python版本)
- java xml的创建和解析记录
- 用redis实现支持优先级的消息队列
- rpm包管理
- 笔记链接
- Spark API 详解/大白话解释 之 groupBy、groupByKey
- iOS - block的简单使用
- Error: Registry key 'Software\JavaSoft\Java Runtime Environment'\CurrentVersion'
- IT类开源书籍推荐
- tiny4412上的应用程序开发示例
- android 视频播放器模板
- list清除重复对象
- 安卓属性动画系列
- DebugView图文教程