spark--actions算子--collect
来源:互联网 发布:edu域名申请 编辑:程序博客网 时间:2024/06/07 08:40
import org.apache.spark.{SparkConf, SparkContext}/** * Created by liupeng on 2017/6/16. */object A_collect { System.setProperty("hadoop.home.dir","F:\\hadoop-2.6.5") def main(args: Array[String]): Unit = { val conf = new SparkConf().setAppName("collect_test").setMaster("local") val sc = new SparkContext(conf) //准备一下数据 val nameList : List[Int] = List(1,2,3,4,5) val numbers = sc.parallelize(nameList) .map(_ * 2) //将RDD序列化到driver端 //建议用foreach action操作;collect在远程集群上遍历RDD的元素,将分布式的在远程集群里面的数据拉取到本地,如果数据量大,会走大量的网络传输,甚至有可能OOM内存溢出 val doubleNumbers : Array[Int] = numbers.collect() for (num <- doubleNumbers) { println(num) } }}
运行结果:
2
4
6
8
10
阅读全文
0 0
- spark--actions算子--collect
- spark--Actions算子--countByKey
- spark--actions算子--count
- spark--actions算子--first
- spark--actions算子--reduce
- spark--actions算子--saveAsObjectFile
- spark--actions算子--saveAsTextFile
- spark--actions算子--takeOrdered
- spark--actions算子--takeSample
- Spark算子:RDDAction操作–first/count/reduce/collect/collectAsMap
- Spark算子:RDD行动Action操作(1)–first、count、reduce、collect
- Spark算子:RDD行动Action操作(1)–first、count、reduce、collect
- Spark 算子
- spark算子
- spark 算子
- Spark算子
- spark算子
- Spark RDD Actions&Transformations
- ArcGIS Server发布GP服务-等值线
- 如何解决/home/oracle: is a directory报警
- arcgis for js 从入门到放弃一:初识和配置详解
- spfa——洛谷P1608 路径统计
- 基于Qt 的贪吃蛇实现
- spark--actions算子--collect
- Light OJ
- 计算机的位、字节、字
- Ubuntu安装完后设置root密码
- pip、conda 换国内源,大大提高下载速度
- C++堆和栈的区别
- DOS常用命令
- gemm() 与 gesvd() 到矩阵求逆(inverse)(根据 SVD 分解和矩阵乘法求矩阵的逆)
- 古北水镇游玩攻略