Spark Streaming基础学习【一】WordCount
来源:互联网 发布:js拖动滑块实现验证码 编辑:程序博客网 时间:2024/05/29 08:52
1.新建maven项目
在opm.xml导入
<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming_2.10</artifactId> <version>${spark.version}</version> </dependency>
2.代码
package day05.dimport org.apache.spark.{SparkConf, SparkContext}import org.apache.spark.streaming.{Seconds, StreamingContext}object StreamingWordCount { def main(args: Array[String]): Unit = { //StreamingContext val conf=new SparkConf().setAppName("StreamingWordCount").setMaster("local[2]") val sc=new SparkContext(conf) val ssc=new StreamingContext(sc,Seconds(5)) //接收数据 val ds=ssc.socketTextStream("192.168.123.151",8888) //DStream是一个特殊的RDD val result=ds.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_) //打印结果 result.print() ssc.start() //等待结束 ssc.awaitTermination() }}
在Linux输入:nc -lk 8888
如果没安装 nc
/usr/bin/yum install nc
然后就输入单词个数每隔5秒钟就统计一次
3.本地跑程序
4.减少日志
新建一个object
package day05.dimport org.apache.log4j.{Level, Logger}import org.apache.spark.Loggingobject LoggerLevels extends Logging{ def setStreamingLogLevels() { val log4jInitialized = Logger.getRootLogger.getAllAppenders.hasMoreElements if (!log4jInitialized) { logInfo("Setting log level to [WARN] for streaming example." + " To override add a custom log4j.properties to the classpath.") Logger.getRootLogger.setLevel(Level.WARN) } }}
在上一个加入
LoggerLevels.setStreamingLogLevels()
也就是:
package day05.dimport org.apache.spark.{SparkConf, SparkContext}import org.apache.spark.streaming.{Seconds, StreamingContext}object StreamingWordCount { def main(args: Array[String]): Unit = { LoggerLevels.setStreamingLogLevels()//减少日志 //StreamingContext val conf=new SparkConf().setAppName("StreamingWordCount").setMaster("local[2]") val sc=new SparkContext(conf) val ssc=new StreamingContext(sc,Seconds(5)) //接收数据 val ds=ssc.socketTextStream("192.168.123.151",8888) //DStream是一个特殊的RDD val result=ds.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_) //打印结果 result.print() ssc.start() //等待结束 ssc.awaitTermination() }}
结果截图:
至此,测试成功
阅读全文
0 0
- Spark Streaming基础学习【一】WordCount
- spark streaming wordcount
- spark streaming wordcount
- spark streaming kafka wordcount
- Spark Streaming 初步学习(一)
- spark streaming初试之wordcount
- Spark Streaming基础学习【二】数值累加
- Spark组件之Spark Streaming学习3--结合SparkSQL的使用(wordCount)
- Spark Streaming源码学习总结(一)
- java8实现spark streaming的wordcount
- 4.Spark Streaming:实时wordcount程序开发
- 7.Spark Streaming:输入DStream之基础数据源以及基于HDFS的实时wordcount程序
- Spark Streaming基础原理
- Spark学习1-wordcount
- Spark学习之WordCount
- Spark基础学习一
- Spark Streaming 理解一
- Spark Streaming实战(一)
- 虚拟机磁盘丢失的数据恢复过程
- HTTP 请求帮助类和日志帮助类
- FFmpeg学习—android 利用ffmpeg 集成libfdk-aac 录制aac 音频文件
- 链接转载
- java提高篇(十一)-----强制类型转换
- Spark Streaming基础学习【一】WordCount
- gazebo:build a robot(系统学习系列)
- javascript刷新当前页面
- 捕获问题sql解决过度cpu消耗问题
- 停止chrome自动更新
- elasticsearch jks文件的位置和使用
- tomcat 修改命令窗口的名字
- jmeter其他特性---debug取样器
- 计算机图形学(一)