imf大数据:第95课:streaming实战,实现在线热搜索词
来源:互联网 发布:快递怎么发掘淘宝客户 编辑:程序博客网 时间:2024/04/28 08:40
import org.apache.spark.SparkConfimport org.apache.spark.streaming.{Duration, Seconds, StreamingContext}object class_95_OnlineHottestItems{ /** * 使用Scala开发集群运行的Spark 在线黑名单过滤程序 * @author DT大数据梦工厂 * 新浪微博:http://weibo.com/ilovepains/ * 不是在线处理数据,都是没有价值的 * * */ def main(args: Array[String]){ val conf=new SparkConf().setMaster("local[2]").setAppName("HottestItems") val ssc=new StreamingContext(conf,Duration(5)) val soDstream=ssc.socketTextStream("master",9999) soDstream .map(_.split(" ")(1))//按照空格分割取出第二个元素 .map(item=>(item,1))//元素转化成turple2 .reduceByKeyAndWindow((v1:Int,v2:Int)=>v1+v2,Seconds(60),Seconds(20))//以60s窗口长度,20s滑动间隔进行元素的累加 .transform(ItemRDD=>ItemRDD//DStream没有排序的算子,所以要转化为rdd .map(pair=>(pair._2,pair._1))//将k,v对调 .sortByKey(false))//对v进行排序 .map(pair=>(pair._2,pair._1))//将K,V复原 .print() ssc.start() ssc.awaitTermination() }}
0 0
- imf大数据:第95课:streaming实战,实现在线热搜索词
- 大数据IMF传奇行动绝密课程第103课:动手实战Spark Streaming Broadcast、Accumulator实现在线黑名单过滤和计数
- 大数据IMF传奇行动绝密课程第95课:通过SparkStreaming的window操作实战模拟新浪微博、百度、京东等热点搜索词案例实战
- 大数据IMF传奇行动绝密课程第94课:SparkStreaming实现广告计费系统中在线黑名单过滤实战
- 第95讲:使用Scala开发集群运行的Spark来实现在线热搜索词获取
- 大数据IMF传奇行动绝密课程第87课:Flume推送数据到Spark Streaming案例实战和内幕源码解密
- 大数据IMF传奇行动绝密课程第82课:Spark Streaming案例动手实战并在电光石火间理解其工作原理
- 大数据IMF传奇行动绝密课程第83课:透彻讲解使用Scala和Java两种方式实战Spark Streaming开发
- 大数据IMF传奇行动绝密课程第98-99课:使用Spark Streaming实战对论坛网站动态行为的多维度分析
- 大数据IMF传奇行动绝密课程第102课:动手实战Spark Streaming自定义Receiver并进行调试和测试
- 大数据IMF传奇行动绝密课程第97课:使用SparkStreaming+SparkSQL实现在线动态计算出特定时间窗口
- 大数据IMF传奇行动绝密课程第67课:spark SQL案例综合实战
- 大数据IMF传奇行动绝密课程第69课:Spark SQL通过Hive数据源实战
- 大数据IMF传奇行动绝密课程第73课:Spark SQL Thrift Server实战
- 大数据IMF传奇行动绝密课程第100-101课:使用Spark Streaming+Spark SQL+Kafka+FileSystem综合案例
- 大数据IMF传奇行动绝密课程第104-114课:Spark Streaming电商广告点击综合案例
- 大数据IMF传奇行动绝密课程第16课:RDD实战(RDD基本操作实战及Transformation流程图)
- 大数据IMF传奇行动绝密课程第61课:Spark SQL数据加载和保存内幕深度解密实战
- 深入理解java异常处理机制
- TextView实现跑马灯/两个跑马灯效果
- ftp服务在iptables防火墙设置
- c++ string reverse 用法
- mac mysql Access denied for user问题有效解决方法
- imf大数据:第95课:streaming实战,实现在线热搜索词
- 21、线程锁
- 【Tesseract】Tesseract 的训练流程
- jQuery技巧
- AngularJS: Error reports on $injector:modulerr
- hdu 1029 Ignatius and the Princess IV
- 【CodeForces 】- Round House(数学,想法很重要啊!!!)
- Google Java编码规范
- c++ istringstream ostringstream stringstream