Hadoop RPC类详解（3）

来源：互联网发布：软件接口设计工具编辑：程序博客网时间：2024/05/18 03:52

Client内部有两个重要的内部类，分别是Call和Connection。

Call类：封装了一个RPC请求，它包含5个成员变量，分别是唯一标识id、函数调用信息param、函数执行返回值value、出错或者异常信息error和执行完成标识符done。由于Hadoop RPC Server采用异步方式处理客户端请求，这使远程过程调用的发生顺序与结果返回顺序无直接关系，而Client端正是通过id识别不同的函数调用的。当客户端向服务器端发送请求时，只需填充id和param两个变量，而剩下的3个变量（value、error和done）则由服务器端根据函数执行情况填充。

Connection类：Client与每个Server之间维护一个通信连接，与该连接相关的基本信息及操作被封装到Connection类中，基本信息主要包括通信连接唯一标识（remoteId）、与Server端通信的Socket（socket）、网络输入数据流（in）、网络输出数据流（out）、保存RPC请求的哈希表（calls）等。操作则包括：

addCall—将一个Call对象添加到哈希表中；

sendParam—向服务器端发送RPC请求；

receiveResponse —从服务器端接收已经处理完成的RPC请求；

run—Connection是一个线程类，它的run方法调用了receiveResponse方法，会一直等待接收RPC返回结果。

当调用call函数执行某个远程方法时，Client端需要进行（如图3-7所示）以下4个步骤。

1）创建一个Connection对象，并将远程方法调用信息封装成Call对象，放到Connection对象中的哈希表中；

2）调用Connection类中的sendRpcRequest()方法将当前Call对象发送给Server端；

3）Server端处理完RPC请求后，将结果通过网络返回给Client端，Client端通过receiveRpcResponse()函数获取结果；

4）Client检查结果处理状态（成功还是失败），并将对应Call对象从哈希表中删除。

3. ipc.Server类分析

Hadoop采用了Master/Slave结构，其中Master是整个系统的单点，如NameNode或JobTracker，这是制约系统性能和可扩展性的最关键因素之一；而Master通过ipc.Server接收并处理所有Slave发送的请求，这就要求ipc.Server 将高并发和可扩展性作为设计目标。为此，ipc.Server采用了很多提高并发处理能力的技术，主要包括线程池、事件驱动和Reactor设计模式等，这些技术均采用了JDK自带的库实现，这里重点分析它是如何利用Reactor设计模式提高整体性能的。

Reactor是并发编程中的一种基于事件驱动的设计模式，它具有以下两个特点：通过派发/分离I/O操作事件提高系统的并发性能；提供了粗粒度的并发控制，使用单线程实现，避免了复杂的同步处理。典型的Reactor实现原理如图3-8所示。

典型的Reactor模式中主要包括以下几个角色。

Reactor：I/O事件的派发者。

0 0