Spark Streaming基础学习【二】数值累加
来源:互联网 发布:女权癌 知乎 编辑:程序博客网 时间:2024/06/05 20:53
package day05.dimport org.apache.spark.{HashPartitioner, SparkConf, SparkContext}import org.apache.spark.streaming.{Seconds, StreamingContext}object StateFulWordCount { //分好组的数据 val updateFunc = (iter: Iterator[(String, Seq[Int], Option[Int])]) => { //iter.flatMap(it=>Some(it._2.sum + it._3.getOrElse(0)).map(x=>(it._1,x))) //iter.map{case(x,y,z)=>Some(y.sum + z.getOrElse(0)).map(m=>(x, m))} //iter.map(t => (t._1, t._2.sum + t._3.getOrElse(0))) iter.map{ case(word, current_count, history_count) => (word, current_count.sum + history_count.getOrElse(0)) } } def main(args: Array[String]): Unit = { LoggerLevels.setStreamingLogLevels() //StreamingContext val conf=new SparkConf().setAppName("StreamingWordCount").setMaster("local[2]") val sc=new SparkContext(conf) sc.setCheckpointDir("f://ss") val ssc=new StreamingContext(sc,Seconds(5)) //接收数据 val ds=ssc.socketTextStream("192.168.123.151",8888) //DStream是一个特殊的RDD val result=ds.flatMap(_.split(" ")).map((_,1)).updateStateByKey(updateFunc,new HashPartitioner(sc.defaultParallelism),true) result.print() ssc.start() //等待结束 ssc.awaitTermination() }}
阅读全文
0 0
- Spark Streaming基础学习【二】数值累加
- Spark-Streaming中累加
- Spark Streaming基础学习【一】WordCount
- spark streaming (二)
- Spark Streaming实战(二)
- Spark Streaming基础原理
- Spark Streaming 再学习
- Spark Streaming学习笔记
- 4.Spark Streaming学习
- Spark Streaming学习
- Spark Streaming 学习笔记
- Spark Streaming学习笔记
- spark学习笔记:Spark Streaming
- Spark学习六:spark streaming
- spark-streaming-[1]-streaming基础NetworkWordCount
- spark-streaming入门(二)
- Spark Streaming基础概念介绍
- Spark Streaming基础概念介绍
- Unity UI系统-NGUI-AtlasMaker
- Django爬过的坑系列 --- 在PyCharm内链接 MySQL数据库
- 5.[easy]Plus one
- python+selenium自动化软件测试(第10章):测试驱动TDD
- HTextView:非常炫酷的 TextView 效果
- Spark Streaming基础学习【二】数值累加
- 使用IDEA+Java+Tomcat搭建远端服务器
- 对于innodb体系架构之后台线程、内存
- 《算法竞赛入门经典》-第六章-数据结构基础
- Java入门(2) —— 变量详解、运算符、定义类和定义方法以及方法的调用
- golang buffer的使用
- upc 3795 食物链(邻接表+记忆dfs)
- atcoder 062D
- 网易2018秋招Java开发岗编程题