Spark 检查点
来源:互联网 发布:粉碎食品安全网络谣言 编辑:程序博客网 时间:2024/06/01 13:54
一般是在具有容错能力,高可靠的文件系统上(比如HDFS, S3等)设置一个检查点路径,用于保存检查点数据。设置检查点可以在应用程序中使用streamingContext.checkpoint(checkpointDirectory)
来指定路径。
如果想要应用程序在失败重启时使用到检查点存储的元数据信息,需要应用程序具有以下两个特性,需要使用StreamingContext.getOrCreate
代码在失败时重新创建StreamingContext
对象:
- 当应用程序是第一次运行时,创建一个新的
StreamingContext
对象,然后开始执行程序处理DStream。 当应用程序失败重启时,可以从设置的检查点路径获取元数据信息,创建一个
StreamingContext
对象,并恢复到失败前的状态。def functionToCreateContext(): StreamingContext = { val ssc = new StreamingContext(...) // 创建一个新的StreamingContext对象 val lines = ssc.socketTextStream(...) // 得到DStreams ... ssc.checkpoint(checkpointDirectory) // 设置checkpoint路径 ssc }// 用checkpoint元数据创建StreamingContext对象或根据上面的函数创建新的对象 val context = StreamingContext.getOrCreate(checkpointDirectory, functionToCreateContext _)// 设置context的其他参数 context. ...// 启动context context.start() context.awaitTermination()
如果checkpointDirectory
路径存在,会使用检查点元数据恢复一个StreamingContext
对象。如果路径不存在,或者程序是第一次运行,则会使用functionToCreateContext
来创建一个新的StreamingContext
对象
0 0
- Spark 检查点
- spark streaming检查点使用
- spark之设置检查点
- spark streaming 检查点机制(checkpoint)
- Spark的RDD检查点实现分析
- 检查点
- 检查点
- 检查点
- 检查点
- 检查点
- 检查点
- 检查点
- 检查点与增量检查点
- TC检查点
- 软件检查点
- 检查点9.2
- 检查点9.3
- 检查点10.1
- 框架 day79 涛涛商城项目-业务中添加redis缓存,jedis使用,redis集群搭建
- Http 状态码详解
- mysql 常用修改表的SQL语句
- SDAutoLayout的使用方法
- nginx.conf文件说明
- Spark 检查点
- [SPOJ687]REPEATS - Repeats(后缀数组+st)
- runtime
- 64位进程调用32位dll的解决方法
- JAVA高并发
- HTML常见的DTD
- 敏捷教练的妥协艺术
- html&css学习笔记
- windows下安装nginx