程序博客网 > 你知我所想我知你所要

Spark流处理(WordCount)

来源：互联网发布：你知我所想我知你所要编辑：程序博客网时间：2024/05/20 16:33

Spark流处理(WordCount)

1. Spark环境

1) 4台CentOs 6.4

2) Hadoop 2.2.0

3) Jdk 1.7

4) Scala 2.10.3

5) Spark 0.9.0

2. 前期准备

由于Spark支持Socket流输入，准备NetCat作为TCP服务器不断对Spark进行word输入。

2.1 NetCat安装

1) yum install -y nc

2.2 启动监听服务

1) nc -l 9999 9999是端口号

3 启动Spark

输入：

/usr/local/spark/bin/run-exampleorg.apache.spark.streaming.exampl.NetworkWordCount local[2] 192.168.178.1829999

解释：192.168.178.182是netcat服务器的IP地址，9999是netcat服务器的端口号。

4 结果

4.1 netcat端输入

4.2 Spark中输出

0 0

你知我所想我知你所要

你知我所想我知你所要

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子集安到通化火车时刻表长春到通化客车长春到通化火车时刻表通化到北京火车时刻表通化三源浦机场通化玉皇山公园旅游吉林通化旅游吉林省通化市通化招聘信息通化百业信息在线看报水立方真正网址通兴通 ,通洁厕坐厕第5季在线播放高压气瓶连排通厕神器厕所塞了怎么快速通厕马桶塞了怎么快速通厕通县通县专区通县物流公司中国通号通号中国通号股吧中国通号股票中国通号招聘中国通号集团通号集团 688009中国通号宾馆云视通号通号建设集团有限公司通号工程局甘人社通2018年458号多号通户户通加密卡卡号在哪学习通答案公众号中国通号688009股吧京医通公众号一号通注册中国通号和中铁哪个好