Spark Scala 二次排序
来源:互联网 发布:裤哥大战淘宝店主 编辑:程序博客网 时间:2024/05/17 06:48
package com.second.sortbysparkimport org.apache.spark.{SparkConf, SparkContext}/** * Created by xxxxx on 3/14/2017. */object SecondarySort { def main(args: Array[String]): Unit = { val sparkConf = new SparkConf().setAppName("second sort").setMaster("local[4]") val sc = new SparkContext(sparkConf) //(1,1193) // (1,661) val dataRDD = sc.textFile("data/medium/ratings.dat")//问题 在于如果 list 过大 怎么弄 ?? val splittedRDD = dataRDD.map(_.split("::")).map(x =>(x(0),x(1).toInt)) //如果是字符串怎么比较 ?? val groupSort = splittedRDD.groupByKey().sortByKey(false).map(x => (x._1,x._2.toList.sortWith(_>_))) groupSort.take(10).foreach(println ) val finalRDD = groupSort.flatMap{ x => val length = x._2.length val array = new Array[(String,Int)](length) for(elem <- 0 until length){ array(elem) = (x._1,x._2(elem)) } array }.take(10) finalRDD.foreach(println ) }}
0 0
- Spark Scala 二次排序
- Spark Scala 二次排序
- Spark:Scala实现二次排序
- Spark——二次排序(scala)
- Spark二次排序(Java+Scala)
- Spark Scala 实现二次排序和相加
- Spark基础排序+二次排序(java+scala)
- Scala之二次排序
- Spark中的二次排序
- spark 二次排序实现
- spark二次排序
- Spark二次排序
- spark二次排序
- spark简单二次排序
- spark二次排序
- Spark之二次排序
- Spark分组二次排序
- Spark Java 二次排序
- frameset标签设计页面
- C++静态库与动态库
- IFE-JS 任务一:零基础JavaScript编码(一)
- Docker cp 命令(用于容器与主机之间的数据拷贝)
- table的td如何设置overflow:scroll
- Spark Scala 二次排序
- ALSA(Advanced Linux Sound Architecture)声卡编程介绍及实例
- Java设计模式之建造者模式
- 打印输入的内容并添加行号
- Z
- Django框架及MySQL安装配置
- POJ:1664 放苹果(递归,思维)
- 最少拦截系统
- Linux线程操作