Hadoop RPC类详解(3)

来源:互联网 发布:软件接口设计工具 编辑:程序博客网 时间:2024/05/18 03:52

Client内部有两个重要的内部类,分别是Call和Connection。

Call类:封装了一个RPC请求,它包含5个成员变量,分别是唯一标识id、函数调用信息param、函数执行返回值value、出错或者异常信息error和执行完成标识符done。由于Hadoop RPC Server采用异步方式处理客户端请求,这使远程过程调用的发生顺序与结果返回顺序无直接关系,而Client端正是通过id识别不同的函数调用的。当客户端向服务器端发送请求时,只需填充id和param两个变量,而剩下的3个变量(value、error和done)则由服务器端根据函数执行情况填充。

Connection类:Client与每个Server之间维护一个通信连接,与该连接相关的基本信息及操作被封装到Connection类中,基本信息主要包括通信连接唯一标识(remoteId)、与Server端通信的Socket(socket)、网络输入数据流(in)、网络输出数据流(out)、保存RPC请求的哈希表(calls)等。操作则包括:

addCall—将一个Call对象添加到哈希表中;

sendParam—向服务器端发送RPC请求;

receiveResponse —从服务器端接收已经处理完成的RPC请求;

run—Connection是一个线程类,它的run方法调用了receiveResponse方法,会一直等待接收RPC返回结果。

当调用call函数执行某个远程方法时,Client端需要进行(如图3-7所示)以下4个步骤。

1)创建一个Connection对象,并将远程方法调用信息封装成Call对象,放到Connection对象中的哈希表中;

2)调用Connection类中的sendRpcRequest()方法将当前Call对象发送给Server端;

3)Server端处理完RPC请求后,将结果通过网络返回给Client端,Client端通过receiveRpcResponse()函数获取结果;

4)Client检查结果处理状态(成功还是失败),并将对应Call对象从哈希表中删除。

3. ipc.Server类分析

Hadoop采用了Master/Slave结构,其中Master是整个系统的单点,如NameNode或JobTracker,这是制约系统性能和可扩展性的最关键因素之一;而Master通过ipc.Server接收并处理所有Slave发送的请求,这就要求ipc.Server 将高并发和可扩展性作为设计目标。为此,ipc.Server采用了很多提高并发处理能力的技术,主要包括线程池、事件驱动和Reactor设计模式等,这些技术均采用了JDK自带的库实现,这里重点分析它是如何利用Reactor设计模式提高整体性能的。

Reactor是并发编程中的一种基于事件驱动的设计模式,它具有以下两个特点:通过派发/分离I/O操作事件提高系统的并发性能;提供了粗粒度的并发控制,使用单线程实现,避免了复杂的同步处理。典型的Reactor实现原理如图3-8所示。

典型的Reactor模式中主要包括以下几个角色。

Reactor:I/O事件的派发者。

0 0