RDD Action 显示
来源:互联网 发布:今日头条淘宝推广 编辑:程序博客网 时间:2024/06/06 01:09
RDD Action 显示
val nums = sc.parallelize(List(1,2,3,6,4,7,5))nums.collect //会引起客户端内存溢出
//返回前k 个元素
nums.take(2)
//返回排序后的前k 个元素
nums.takeOrdered(2)
//返回第一个元素
nums.first
//返回随机k个元素
nums.takeSample(true,2) //不替换
nums.takeSample(false,2) //替换
nums.foreach(println)
//合并集合元素
nums(_+_)
key/value 返回一个hashmap 记录每一个key有多少个value
val a = sc.parallelize(List(("spark",1),("hadoop",1),("storm",1),("storm",1)))
a.countByKey
//将RDD保存到HDFS中
nums.saveAsTextFile("/aa")
val a = sc.parallelize(List(("spark",1),("hadoop",1),("storm",1),("storm",1)))
a.countByKey
res21: scala.collection.Map[String,Long] = Map(spark -> 1, hadoop -> 1, storm -> 2)
0 0
- RDD Action 显示
- Spark算子-RDD Action(saveAsNewAPIHadoopFile)
- spark中RDD的transformation&action
- 学习spark:三、RDD的action操作
- spark RDD transformation和action操作
- Spark shell里RDD action失败
- spark中RDD的transformation&action
- Spark RDD使用详解5--Action算子
- RDD Transformation和Action源码剖析
- spark RDD transformation与action函数整理
- spark RDD action job的提交过程
- 通过例子学习spark rdd--Action函数
- spark RDD算子(十一)之RDD Action 保存操作saveAsTextFile,saveAsSequenceFile,saveAsObjectFile,saveAsHadoopFile 等
- Spark RDD Action 详解---Spark学习笔记8
- 当触发一个RDD的action后DAGScheduler的动作
- 【Spark】RDD操作详解4——Action算子
- 【Spark】RDD操作详解4——Action算子
- Spark算子:RDD行动Action操作(7)–saveAsNewAPIHadoopFile、saveAsNewAPIHadoopDataset
- JSON 数据格式解析
- Android library上传到jcenter
- keil C51使用串口时程序跑死的问题
- 快速开发之代码生成器(asp.net mvc4 + easyui + knockoutjs)
- python_4(tuple_元组)
- RDD Action 显示
- 我的第一篇
- 20点提高网站访问速度缩短网页加载时间(转developer.51cto.com)
- iOS加载本地Json文件,b并转为模型数据
- eclipse中的插件安装(svn、maven、jetty等)
- jvm 类初始化过程代码实战分析
- Cracer 2015 最新 价值1500元web渗透脚本入侵百集教程分享(无key)
- C语言自加问题
- 文章标题