thransformation操作

来源:互联网 发布:one软件 编辑:程序博客网 时间:2024/06/15 19:56

1、map:将集合中每个元素乘以2
2、filter:过滤出集合中的偶数
3、flatMap:将行拆分为单词
4、groupByKey:将每个班级的成绩进行分组
5、reduceByKey:统计每个班级的总分
6、sortByKey:将学生分数进行排序
7、join:打印每个学生的成绩
//使用join算子关联两个RDD,jion之后还是会根据key进行join,返回javapairRDD;JavaPairRDD的第一个泛型类型是之前两个RDD的key的类型,因为是通过key进行join的;第二个泛型类型Tuple < v1,v2 >类型,tuple的两个泛型分别是之前两个RDD的value类型。
8、cogroup:打印每个学生的成绩
//相当于一个KEY join上的所有value都给放到一个Iterable里面去了。

原创粉丝点击