spark groupByKey操作
来源:互联网 发布:淘宝店托管 公司 编辑:程序博客网 时间:2024/06/05 15:34
// groupByKey算子,返回的还是JavaPairRDD
// 但是,JavaPairRDD的第一个泛型类型不变,第二个泛型类型变成Iterable这种集合类型
// 也就是说,按照了key进行分组,那么每个key可能都会有多个value,此时多个value聚合成了Iterable
public static void myGroupByKey(){
SparkConf conf=new SparkConf()
.setMaster("local")
.setAppName("myGroupByKey");
JavaSparkContext sc=new JavaSparkContext(conf);
List list=Arrays.asList(new Tuple2<String,String>("c1","cai"),new Tuple2<String,String>("c2","niao"),
new Tuple2<String,String>("c1","huo"),new Tuple2<String,String>("c2","niao"));
JavaPairRDD<String, String> listRdd= sc.parallelizePairs(list);
JavaPairRDD<String, Iterable<String>> groupRdd=listRdd.groupByKey();
groupRdd.foreach(new VoidFunction<Tuple2<String, Iterable<String>>>(){
@Override
public void call(Tuple2<String, Iterable<String>> tuple)
throws Exception {
// TODO Auto-generated method stub
System.out.println("key:"+tuple._1);
Iterator<String> it=tuple._2.iterator();
while(it.hasNext())
System.out.println("-----values:"+it.next());
}
});
}
结果:
key:c2
-----values:niao
-----values:niao
key:c1
-----values:cai
-----values:huo
- spark groupByKey操作
- Spark 读取Hbase表数据并实现类似groupByKey操作
- 3.3 Spark RDD 键值转换操作3-groupByKey、reduceByKey、reduceByKeyLocally
- [spark]groupbykey reducebykey
- spark--transform算子--groupByKey
- Spark算子:RDD键值转换操作(3)–groupByKey、reduceByKey、reduceByKeyLocally
- Spark算子:RDD键值转换操作(3)–groupByKey、reduceByKey、reduceByKeyLocally
- Spark算子:RDD键值转换操作(3)–groupByKey、reduceByKey、reduceByKeyLocally
- spark RDD算子(七)之键值对分组操作 groupByKey,cogroup
- spark学习-21-Spark的groupByKey
- groupByKey实例分析Spark Hash Shuffle
- Spark groupbykey和cogroup使用示例
- Spark源码之reduceByKey与GroupByKey
- Spark API编程动手实战-04-以在Spark 1.2版本实现对union、groupByKey、join、reduce、lookup等操作实践
- 在Spark中尽量少使用GroupByKey函数
- 【Spark系列2】reduceByKey和groupByKey区别与用法
- 在Spark中尽量少使用GroupByKey函数
- Spark API 详解/大白话解释 之 groupBy、groupByKey
- Invert Binary Tree 递归
- 如何把sqlserver中的列转换成行,行转换成列,显示
- JavaScript数组
- 从零开始学_JavaScript_系列(16)——js系列<5>(正则表达式)
- DBSCAN算法详解
- spark groupByKey操作
- c++作业5
- 【GIT】使用GIT GUI 连接到conding码库教程
- Android中的自定义View与Notification
- poj之旅——1862
- HTML解释器和DOM模型
- POJ2251-Dungeon Master-BFS
- Gazebo与ros_control(2):七自由度机械臂和两轮差速运动小车
- php中include()和require()的区别