整理spark中的job stage task几个概念以及运行案例

来源:互联网 发布:夏朝存在吗 知乎 编辑:程序博客网 时间:2024/06/03 18:06

Job :

是一个比task 和 stage 更大的逻辑概念,job 可以认为是我们在driver 或是通过spark-submit 提交的程序中一个action ,在我们的程序中有很多action  所有也就对应很多的jobs


Stage:

 是spark 中一个非常重要的概念 ,在一个job 中划分stage 的一个重要依据是否有shuflle 发生 ,也就是是否会发生数据的重组 (重新组织数据)。在一个stage 内部会有很多的task 被执行,在同一个stage 中 所有的task 结束后才能根据DAG 依赖执行下一个stage 中的task.


在spark streaming中,一个application可以在时间维度上划分为无数个job, 一个job 有很多任务组成,每组任务可以任务是一个stage , 而Task 是spark 中另一个很重要的概念 ,

task 跟 partition  block 等概念紧密相连 ,task 是执行job 的逻辑单元 ,在task 会在每个executor 中的cpu core 中执行





下面是一个基于streaming实时计算的wordcount案例:


1. 首先基于yarn-cluster的模式 提交一个wordcount  application



2.   在sparkcontext配置中  Durations.seconds(1) 设置为1秒,因此相隔1秒的时间段内的RDD数据 作为计算对象 来触发一个action,也就是一个job




3.  在id 为4988的job中,根据wordcount的逻辑主要有两个stage 




4.   点击id为9977的 stage 即对应的foreach stage中,可以看到 该stage 由N个task来实际执行计算任务






版权声明:本文为博主原创文章,未经博主允许不得转载。
阅读全文
0 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 一颗大牙长歪了怎么办 一颗牙齿长偏了怎么办 一个门牙长歪了怎么办 儿童牙齿长歪了怎么办 孩子牙齿长歪了怎么办 宝宝门牙长歪了怎么办 一颗牙齿挤歪了怎么办 后槽牙掉了一块怎么办 最里面的牙掉了怎么办 成年了牙齿掉了怎么办 我的门牙豁牙子怎么办 小孩牙齿长得稀怎么办 后槽牙掉了一颗怎么办 前门牙掉了一颗怎么办 牙齿黄怎么办小苏打美白牙齿 1岁宝宝牙齿发黄怎么办 宝宝一岁牙齿黄怎么办 宝宝出的牙黄怎么办 我的牙齿很黄怎么办 小孩换的牙发黄怎么办 换牙后牙齿变黄怎么办 抽烟让牙齿变黄怎么办 抽烟把牙齿抽黄了怎么办 牙齿抽烟有黑色污渍怎么办 抽烟抽的牙黄了怎么办 宝宝换牙长歪了怎么办 30岁地包天怎么办 2岁宝宝地包天怎么办 23岁牙齿天包地怎么办 婴儿嘴巴天包地怎么办 天包地怎么办带保持器 宝宝牙齿地包天怎么办 狗狗牙齿断了怎么办 牙齿有窟窿还疼怎么办 龋洞里面很臭怎么办 大牙掉了一半疼怎么办 牙侧面掉了一半怎么办 后大牙掉了一半怎么办 9岁牙龈上长牙齿怎么办 2颗门牙中间黑了怎么办 牙表面有个小洞怎么办