Spark Streaming操作笔记
来源:互联网 发布:js给a标签添加属性值 编辑:程序博客网 时间:2024/05/19 16:29
linux同步时间:ntpdate -u -ntp1.aliyun.com
安装插件:yum -y install net-tools,yum -y install nc
开发Streaming:
1.导入包
2.开发Streaming代码(1)local的数量必须设置大于1,
使用spark streaming代码:
def main(args: Array[String]): Unit = { val conf = new SparkConf().setMaster("local[2]").setAppName("streamFirst") val sc = new SparkContext(conf) sc.setLogLevel("WARN")//设置日志等级 val streamingContext = new StreamingContext(sc,Seconds(5)) //设置消息接收和端口 val lines = streamingContext.socketTextStream("192.168.200.10",9999) lines.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).print() streamingContext.start() streamingContext.awaitTermination() sc.stop()}
遇到的问题:
lines.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).print()
如果这里用lines.map的话会出现:
SparkException: Cannot use map-side combining with array keys.错误。
阅读全文
0 0
- Spark Streaming操作笔记
- Kakfka-Spark Streaming-Spark SQL操作笔记
- Spark Streaming学习笔记
- Spark Streaming 学习笔记
- Spark Streaming学习笔记
- Pro Spark Streaming笔记
- spark学习笔记:Spark Streaming
- Spark Streaming的窗口操作
- Spark Streaming 的 UpdateStateByKey操作
- Spark Streaming的窗口操作
- Spark Streaming 3:转换操作
- Spark Streaming中的操作函数
- Spark Streaming中的操作函数
- Spark学习笔记-Streaming-1
- Spark学习笔记-Streaming-Flume
- spark-streaming学习笔记总结
- Spark Streaming笔记(一)
- spark-streaming 2012 论文笔记
- HQL语句
- 随机生成N位验证码的函数
- Algorithm之路十:Regular Expression Matching
- 使用Maven开发hbase的例子
- Oracle 查看表空间的大小及使用情况sql语句
- Spark Streaming操作笔记
- OKhttp--拦截器
- volatile关键字
- angular修改数组
- PDF预览之PDF.js的github翻译
- tomcat配置jndi+spring使用jndi数据源
- CartExpanableListview自适应有多少数据就多长
- 大数据学习材料整理
- Lucene的简单使用