Structred Streaming之Streaming Query分析
来源:互联网 发布:电影知无涯者拉马努金 编辑:程序博客网 时间:2024/04/30 18:50
Structred Streaming之Streaming Query分析
- 在用户的应用程序中,用户会调用DataStreamWriter.start()方法发起一个Streaming query。
- 在DataStreamWriter中,会调用df.sparkSession.sessionState.streamingQueryManager.startQuery方法开始查询。
StreamingQueryManager调用createQuery私有方法创建Query。
private def createQuery( userSpecifiedName: Option[String], userSpecifiedCheckpointLocation: Option[String], df: DataFrame, sink: Sink, outputMode: OutputMode, useTempCheckpointLocation: Boolean, recoverFromCheckpointLocation: Boolean, trigger: Trigger, triggerClock: Clock): StreamingQueryWrapper
StreamingQueryWrapper是StreamExecution的一个Wrapper:
class StreamExecution( override val sparkSession: SparkSession, override val name: String, checkpointRoot: String, analyzedPlan: LogicalPlan, val sink: Sink, val trigger: Trigger, val triggerClock: Clock, val outputMode: OutputMode) extends StreamingQuery with ProgressReporter with Logging
- StreamingQueryManager调用query.streamingQuery.start()方法,在StreamExecution中启动microBatchThread线程,在该线程中执行runBatches()核心方法。
- 在triggerExecutor.execute()方法中触发事件处理:
- 从故障中恢复:populateStartOffsets(),从Sink中恢复,避免重复处理
- 正常情况:constructNextBatch() ,轮训所有数据源,看是否有新数据需要处理
- 在triggerExecutor.execute()方法中触发事件处理:
0 0
- Structred Streaming之Streaming Query分析
- Streaming query results
- Streaming
- HTTP Live Streaming 分析
- Spark Streaming实例分析
- Spark Streaming实例分析
- Spark Streaming源码分析
- spark-streaming源码分析
- Spark Streaming实例分析
- Spark Streaming实例分析
- Spark Streaming Backpressure分析
- Spark Streaming Backpressure分析
- Spark Streaming分析
- HTTP Progressive Streaming 分析
- Spark Streaming Backpressure分析
- Spark Streaming Backpressure分析
- Gson使用方法之streaming
- Spark 之Streaming--原理
- sql优化的一些总结
- 分享一下简单的android SharedPreferences本地存储数据工具类
- 无法解决“Microsoft.SharePoint.Security, Version=15.0.0.0,”与“Microsoft.SharePoint.Security, Version=14.0.0.0”之间的冲突
- MyBatis第三步、实现数据的增删改查
- java开发常用软件及插件官方下载地址
- Structred Streaming之Streaming Query分析
- 数据库主码、外码
- Struts2如何操作Request、Session和Application对象
- java 23种设计模式及具体例子
- Galera Cluster
- web安全————文件上传漏洞
- MyBatis第四步、多表联合查询
- sql server2008安装时提示重启计算机失败怎么办
- 一个程序员的年终牢骚