Spark-Streaming 使用flume的push方式进行流式处理
来源:互联网 发布:多重网络 编辑:程序博客网 时间:2024/06/13 03:07
import org.apache.spark.SparkConfimport org.apache.spark.streaming.flume.FlumeUtilsimport org.apache.spark.streaming.{Seconds, StreamingContext}/** * Created by ZX on 2015/6/22. */object FlumePushWordCount { def main(args: Array[String]) { val host = args(0) val port = args(1).toInt LoggerLevels.setStreamingLogLevels() val conf = new SparkConf().setAppName("FlumeWordCount")//.setMaster("local[2]") val ssc = new StreamingContext(conf, Seconds(5)) //推送方式: flume向spark发送数据 val flumeStream = FlumeUtils.createStream(ssc, host, port) //flume中的数据通过event.getBody()才能拿到真正的内容 val words = flumeStream.flatMap(x => new String(x.event.getBody().array()).split(" ")).map((_, 1)) val results = words.reduceByKey(_ + _) results.print() ssc.start() ssc.awaitTermination() }}
<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming-flume_2.10</artifactId> <version>${spark.version}</version></dependency>
缺点: 只有一个端口接收数据
阅读全文
0 0
- Spark-Streaming 使用flume的push方式进行流式处理
- Spark Streaming与Flume集成小测试:PUSH的方式
- Spark streaming整合flume之Push方式
- 使用Flume+Logstash+Kafka+Spark Streaming进行实时日志处理分析【公安大数据】
- Spark Streaming和Flume的结合使用
- 基于Flume+Kafka+Spark-Streaming的实时流式处理完整流程
- 基于Flume+Kafka+Spark-Streaming的实时流式处理完整流程
- Flume+Kafka+Spark-Streaming的实时流式处理完整流程
- Flume+Kafka+Spark-Streaming的实时流式处理完整流程
- flume-Spark整合-push方式
- Spark Streaming整合Flume&Kafka打造通用流处理基础
- Flume Push数据到spark streaming或者接收Spark streaming的poll数据时实际运行程序总结
- Spark streaming整合Flume之pull方式
- flume+kafka+spark streaming日志流式处理系统搭建实验
- Spark Streaming 和 Flume-NG的整合
- spark流数据处理:Spark Streaming的使用
- spark流数据处理:Spark Streaming的使用
- Spark streaming and flume
- 读书笔记--SQL必知必会21--使用游标
- 读书笔记--SQL必知必会22--高级SQL特性
- 读书笔记汇总 --- SQL必知必会(第4版)
- 读书笔记--SQL必知必会--Tips
- 读书笔记--SQL必知必会--常用MySQL(MariaDB)命令
- Spark-Streaming 使用flume的push方式进行流式处理
- 读书笔记汇总 --- 用Python写网络爬虫
- NFS网络文件系统基本配置、利用kerberos保护nfs输出
- 读书笔记--用Python写网络爬虫00--建立练习环境
- 读书笔记--用Python写网络爬虫01--网络爬虫简介
- Docker
- 读书笔记--用Python写网络爬虫02--数据抓取
- web学习阶段总结(3)大作业小结
- Git