Spark 基本术语表
来源:互联网 发布:lol索拉卡技能数据 编辑:程序博客网 时间:2024/05/16 12:54
以下内容来自 http://spark.apache.org/docs/2.1.0/cluster-overview.html#glossary , 需要对 spark 的整个运行过程有所了解才能真正理解这些术语的涵义.
可以先看一下 http://dblab.xmu.edu.cn/blog/972-2 了解一下概况.
Spark 内部术语解释
- Application:基于 Spark 的用户程序,包含了 driver 程序和集群上的 executor;
- Driver Program:运行 main 函数并且新建 SparkContext 的程序;
- Cluster Manager:在集群上获取资源的外部服务 (例如:standalone,Mesos,Yarn);
- Worker Node:集群中任何可以运行应用代码的节点;
- Executor:是在一个 worker node 上为某应用启动的一个进程,该进程负责运行任务,并且负责将数据存在内存或者磁盘上。每个应用都有各自独立的 executors;
- Task:被送到某个 executor 上的工作单元;
- Job:包含很多任务的并行计算,可以与 Spark 的 action 对应;
- Stage:一个 Job 会被拆分很多组任务,每组任务被称为 Stage(就像 Mapreduce 分 map 任务和 reduce 任务一样)。
0 0
- Spark 基本术语表
- Spark基本术语
- Spark基本术语表+基本架构+基本提交运行模式
- 基本术语
- Spark集群术语
- Spark术语解释
- spark核心术语解析
- Spark术语解释
- Spark术语理解
- Spark的术语
- 一些重要的spark术语
- Spark组件和术语定义
- CPU基本术语
- 无线数据基本术语
- .Net基本术语
- GPRS的基本术语
- 基本网络术语
- 图的基本术语
- struts1的学历历程
- java大数取模(一)
- NVIDIA Jetson Tx1(1)
- 实战RecyclerView头部尾部添加方法
- 浅谈HTTP中Get与Post的区别
- Spark 基本术语表
- centos7挂载ntfs格式移动硬盘/u盘
- 基于 Django1.10 文档的深入学习(19)——Working with forms
- 程序员,你说你不加班!行吗?
- 设计模式(一)单例模式
- Linux初级驱动执行流程
- 文件锁 flock/fcntl
- 数学之美阅读笔记(2)
- Volatile的陷阱