Spark学习笔记(二)
来源:互联网 发布:宫内知美三级名字 编辑:程序博客网 时间:2024/05/16 04:53
部署图
从部署图中可以看到
- 整个集群分为 Master 节点和 Worker 节点,相当于 Hadoop 的 Master 和 Slave 节点。
- Master节点上常驻 Master 守护进程,负责管理全部的Worker 节点。
- Worker 节点上常驻 Worker 守护进程,负责与Master 节点通信并管理 executors。
- Application 就是用户自己写的 Spark 程序(driver program),比如 WordCount.scala。如果 driver program 在Master 上运行,比如在 Master 上运行
./bin/run‐example SparkPi 10
那么 SparkPi 就是 Master 上的 Driver。如果是 YARN 集群,那么 Driver 可能被调度到 Worker 节点上运行(比如上
图中的 Worker Node 2)。
- 每个 Worker 上存在一个或者多个 ExecutorBackend 进程。每个进程包含一个 Executor对象,该对象持有一个线程概览部署图 池,每个线程可以执行一个 task。 每个 application 包含一个 driver 和多个executors,每个 executor 里面运行的 tasks 都属于同一个 application。
- 在 Standalone版本中,ExecutorBackend 被实例化成 CoarseGrainedExecutorBackend 进程。
我们使用重点内容 Spark 自带的 examples 包中的 GroupByTest,假设在 Master 节点运行,命令是
bin/run‐example GroupByTest 100 10000 1000 36
0 0
- Spark学习笔记(二)
- spark学习笔记二
- Spark Core学习笔记(二)
- Spark (Python版) 学习笔记(二)
- Spark学习笔记二 RDD
- (二)spark学习笔记-IDE以及部署
- Spark学习笔记(二)-弹性分布式数据集RDDs
- Spark开发笔记(二)
- Spark 学习笔记二开发环境
- Apache Spark MLlib学习笔记(二)Spark RDD简介和基本操作
- spark机器学习笔记:(二)用Spark Python进行数据处理和特征提取
- Spark (Python版) 零基础学习笔记(二)—— Spark Transformations总结及举例
- (二)Spark学习系列
- Spark学习笔记(一)--Spark架构
- 【spark 学习笔记】Spark学习笔记精华(1)
- Spark学习笔记(三)
- Spark学习笔记(四)
- Spark学习笔记(五)
- ST算法
- linux下安装jdk,tomcat,mysql
- SpringMVC-----SpringMVC接收多个对象参数
- poj 2240
- Linux常用命令
- Spark学习笔记(二)
- 使用for循环输出杨辉三角
- SpringMVC
- 常见framework源码分析
- struts2获取参数和数据校验
- Hibernate关系映射
- Hadoop2.0的HA介绍
- typedef用法详解
- C++练习:返回数组的引用