解析Spark Executor内幕,详解CoarseGrainedExecutorBackend

来源：互联网发布：php本地环境搭建编辑：程序博客网时间：2024/05/22 17:39

Spark Executor工作原理

ExecutorBackend注册

Executor实例化

Executor具体是如何工作的？

CoarseGrainedExecutorBackend，粗粒度的ExecutorBackend进程。

Worker为什么要启动另外一个进程？

Worker本身是管理当前机器上的资源，变动资源的时候向Master汇报。有很多应用程序，就需要很多Executor。这样程序之间不会一个奔溃导致所有的都奔溃。

1.在CoarseGrainedExecutorBackend启动时，向Driver注册Executor其实质是注册ExecutorBackend实例，和Executor实例之间没有直接的关系！！！

2.CoarseGrainedExecutorBackend是Executor运行所在的进程名称，Executor才是真正在处理Task的对象，Executor内部是通过线程池的方式来完成Task的计算的。

3. CoarseGrainedExecutorBackend和Executor是一一对应的。

4. CoarseGrainedExecutorBackend是一个消息通信体（其实现了ThreadSafeRpcEndpoint）。可以发送信息给Driver，并可以接收Driver中发过来的指令，例如启动Task等。

5.在Driver进程中，有两个至关重要的Endpoint，

a）第一个就是ClientEndpoint，主要负责向Master注册当前的程序；是AppClient的内部成员。

b）另外一个就是DriverEndpoint，这是整个程序运行时候的驱动器！！是CoarseGrainedExecutorBackend的内部成员。

6.在Driver中通过ExecutorData封装并注册ExecutorBackend的信息到Driver的内存数据结构ExecutorMapData中。ExecutorMapData是CoarseGrainedSchedulerBackend的成员。最终是注册给CoarseGrainedSchedulerBackend。

private[cluster] class ExecutorData(
   val executorEndpoint: RpcEndpointRef,
   val executorAddress: RpcAddress,
   override val executorHost: String,
   var freeCores: Int,
   override val totalCores: Int,
   override val logUrlMap: Map[String, String]
) extends ExecutorInfo(executorHost, totalCores, logUrlMap)

7.实际在执行的时候，DriverEndpoint会把信息写入CoarseGrainedSchedulerBackend的内存数据结构ExecutorMapData中，所以说最终是注册给CoarseGrainedSchedulerBackend，也就是说CoarseGrainedSchedulerBackend掌握了为当前程序分配的所有的ExucutorBackend进程，而在每一个ExecutorBackend进程实例中会通过Executor对象来负责具体Task的运行。在欲行的时候使用syschronized关键字来保证ExecutorMapData安全的并发写操作。

8.CoarseGrainedExecutorBackend收到DriverEndpoint发送过来的RegisteredExecutor消息后会启动Executor实例对象，而Executor实例对象是事实上负责真正Task计算的。

Executor是如何工作的？

1.当Driver发送过来Task的时候，其实是发送给了CoarseGrainedExecutorBackend这个RpcEndpoint，而不是直接发送给了Executor（Executor由于不是消息循环体，所以永远无法直接接收远程发送过来的信息）。

case LaunchTask(data) =>  if (executor == null) {    logError("Received LaunchTask command but executor was null")    System.exit(1)  } else {    val taskDesc = ser.deserialize[TaskDescription](data.value)    logInfo("Got assigned task " + taskDesc.taskId)    executor.launchTask(this, taskId = taskDesc.taskId, attemptNumber = taskDesc.attemptNumber,      taskDesc.name, taskDesc.serializedTask)  }

2.ExecutorBackend在收到Driver中发送过来的消息后，会通过调用launchTask来交给Executor去执行。

case LaunchTask(data) =>  if (executor == null) {    logError("Received LaunchTask command but executor was null")    System.exit(1)  } else {    val taskDesc = ser.deserialize[TaskDescription](data.value)    logInfo("Got assigned task " + taskDesc.taskId)    executor.launchTask(this, taskId = taskDesc.taskId, attemptNumber = taskDesc.attemptNumber,      taskDesc.name, taskDesc.serializedTask)  }

在介绍CoarseGrainedExecutorBackend的启动流程前，先了解下CoarseGrainedExecutorBackend。我们知道Executor负责计算任务，即执行task，而Executor对象的创建及维护是由CoarseGrainedExecutorBackend负责的，CoarseGrainedExecutorBackend在Spark运行期是一个单独的进程，在Worker节点可以通过Java的jps命令查看，如下

如何启动上图中的CoarseGrainedExecutorBackend进程是我们后面介绍的重点，先看下其定义及UML

从上图可以得到如下信息

CoarseGrainedExecutorBackend是RpcEndpoint的子类，能够和Driver进行RPC通信，其生命周期方法onStart一定要关注，看执行了哪些动作。
CoarseGrainedExecutorBackend维护了两个属性executor和driver，executor负责运行task，driver负责和Driver通信。
ExecutorBackend有抽象方法statusUpdate，负责将Executor的计算结果返回给Driver。

最后，CoarseGrainedExecutorBackend是spark运行期的一个进程，Executor运行在该进程内。

启动CoarseGrainedExecutorBackend

接着Spark 任务调度之Launch Executor介绍，最后讲到Worker进程收到LaunchExecutor消息，然后，Worker将收到的消息封装为ExecutorRunner对象，调用其start方法，如下

start方法启动线程，调用ExecutorRunner的fetchAndRunExecutor方法，fetchAndRunExecutor方法中将收到的信息拼接为Linux命令，然后使用ProcessBuilder执行linux命令启动CoarseGrainedExecutorBackend，和启动Driver的方式如出一辙，fetchAndRunExecutor方法如下

ProcessBuilder执行的Linux命令大致如下

上面的java命令会调用CoarseGrainedExecutorBackend的main方法，main方法中处理命令行传入的参数，然后创建RpcEnv，并注册CoarseGrainedExecutorBackend，如下

至此，启动CoarseGrainedExecutorBackend就介绍完了，由于将CoarseGrainedExecutorBackend注册到RpcEnv会调用其onStart方法，所以下一篇就是查看onStart方法中进行了哪些操作。

总结

介绍了CoarseGrainedExecutorBackend的作用及启动流程，大致如下
这里写图片描述

阅读全文

0 0