【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用004-Flink的作业调度情况001
来源:互联网 发布:南京邮电大学网络信息 编辑:程序博客网 时间:2024/06/03 13:20
一、作业(Job)和调度(Scheduling)
1.调度(Scheduling)
1.Flink集群一般有一个或多个TaskManager,每个TaskManager有一个或多个slot来区分不同的资源(当前是内存)2.每个slot都可以运行整个pipeline,这些pipeline中的并行任务都可以并行的运行在各个slot之中3.可通过SlotSharingGroup和CoLocationGroup来定义任务在共享任务槽的行为,可定义为自由共享, 或是严格定义某些任务部署到同一个任务槽中。
1.本例中有2个TaskManager,每个TaskManager划分了3个slot,一共6个slot。2.本例是一个source-map-reduce的pipeline例子,source并行度为4,map并行度为4,reduce并行度为3.最大并行度为4.3.图中可见TaskManager1使用2个slot,分别运行蓝,黄2个subtask的pipeline。4.图中可见TaskManager2使用2个slot,分别运行红,橙2个subtask的pipeline。
2.JobManager数据结构(JobManager Data Structures)
1.client将program解析成dataflow,并将dataflow的描述信息JobGraph提交给JobManager。JobGraph包含Operator(JobVertex),IntermediateResult(IntermediateDataSet),并行度,执行代码,附加的库等信息。2.JobManager将JobGraph并行化处理成ExecutionGraph。Operator(JobVertex)处理成包含多个Subtask(ExecutionVertex)的ExecutionJobVertex。IntermediateResult(IntermediateDataSet)并行化成含多个IntermediateResultPartition的IntermediateResult.也就是任务并行化: JobVertex->ExecutionJobVertex(含多个ExecutionVertex)数据并行化: IntermediateResult->IntermediateResult(含多个IntermediateResultPartition)
阅读全文
0 0
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用004-Flink的作业调度情况001
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用005-Flink的作业调度情况002
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用001-Flink的内存管理001
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用002-Flink的内存管理002
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用003-Flink的内存管理003
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用013-Flink在批处理中常见的sink和source001
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用014-Flink在批处理中常见的sink和source002
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用020-Flink中参数传递和容错设定004
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用021-Flink中OutFormat设置(Scala版)001
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用015-Flink中广播变量和分布式缓存001
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用017-Flink中参数传递和容错设定001
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用009-Slot和Parallelism的深入分析004
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用006-Slot和Parallelism的深入分析001
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用022-Flink中OutFormat设置(Scala版)002
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用023-Flink中OutFormat设置(Scala版)003
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用016-Flink中广播变量和分布式缓存002
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用018-Flink中参数传递和容错设定002
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用019-Flink中参数传递和容错设定003
- Exception in thread "main" com.sun.xml.internal.ws.model.RuntimeModelerException
- Flex SDK Ant
- 二叉树非递归遍历(前中后)
- openCV中查找表的作用
- 黑马商城项目_商城主页底部导航
- 【云星数据---Apache Flink实战系列(精品版)】:Apache Flink高级特性与高级应用004-Flink的作业调度情况001
- 图像处理(六):二值化
- Spring BeanFactory源码解析
- IHS Kingdom Suite Advanced(地震解释软件) v2016.1官方版下载
- leetcode-16-3Sum Closest
- PAT乙级1064
- C语言常用排序
- 一. FragmentLayout 加上 TabLayout 进行嵌套碎片
- 网络协议-TCP和UDP最完整的区别介绍