基于消息的分布式架构设计

来源：互联网发布：淘宝类目在哪里编辑：程序博客网时间：2024/04/28 07:25

背景：

随着社会的发展，经济的飞跃，传统的单系统模式（webApp+DB）已经很难满足业务场景的需要。企业系统开始不断演化成多个子系统并存协作的局面。大大降低了系统间的耦合性，更重要的便于子系统的扩展、升级、维护等。

谈到系统间的协作，目前常用两种方式：

1、基于Http协议

通过客户端发起的get、post请求，服务端接收request请求，处理请求，得到响应内容，通过网络传送到客户端，由浏览器解析出一个可视化的页面。

这种交互最大的优势是实时性，通过HTTP请求连接各个子系统，从而跨服务器来完成一个完整的业务流程。缺点协议请求头的信息较少，一般都是关键参数，完整数据由下一个子系统从数据库、文件系统来获取，从来保证前后的业务数据衔接。

2、基于消息的模式。

这种模式一个很重要前提是对实时性要求不高。优点可以有效降低模块的耦合性，减轻主干业务流程，将大量的业务交由后台任务来处理，有效缩短系统响应时间，提高系统TPS。

比如用户下单成功后发送邮件功能，属于非主干功能，完全可以从下单的主干业务逻辑剥离出来，从来提高下单的响应速度。而发送邮件的功能则由邮件服务器接收异步消息来跟踪处理，带有点分布式集群的感觉，

将一个任务有效拆分到多台服务器来完成。

所谓消息本质上是一种数据结构（当然，对象也可以看做是一种特殊的消息），它包含生产者与消费者双方都能识别的数据，这些数据需要在不同的服务器之间进行传递，并可能会被多个完全不同的客户端消费。

消息队列降低了生产者和消费者之间的耦合性，他们不会存在直接的代码依赖，方便各自的扩展，比如生产者因为业务下线，导致代码下线，而消费端不用同时跟进处理，只是队列不会有消息，这样方便于更加灵活的协调开发资源，而不必一方下线，所有的依赖全部受影响，产生较高维护成本。另外我们也可以随意对生产者和消费者扩展，引入多个消息队列，他们之间的依赖可以配置在XML文件中，通过JNDI来获取消息队列Queue，每次加载时，通过lookup服务首先通过读取配置文件来获取通道。

常见的消息模型分为：点对点模型；发布-订阅模型

点对点模型：Point to Point，消息被生产者放到一个队列中，消费者从消息队列中取走消息。消息一旦被一个消费者取走后，消息就从队列中移除。这意味着即使有多个消费观察一个队列，但一个消息只能被一个消费者取走。

发布-订阅模型：Publish/Subscribe，发布者发布一条消息可以发送给所有的订阅用户，所有的订阅用户都有处理某一条消息的机会。

对于订阅者而言，有两种处理消息的方式。一种是广播机制，这时消息通道中的消息在出列的同时，还需要复制消息对象，将消息传递给多个订阅者。例如，有多个子系统都需要获取从CRM系统传来的客户信息，并根据传递过来的客户信息，进行相应的处理。此时的消息通道又被称为Propagation通道。另一种方式则属于抢占机制，它遵循同步方式，在同一时间只能有一个订阅者能够处理该消息。实现Publisher-Subscriber模式的消息通道会选择当前空闲的唯一订阅者，并将消息出列，并传递给订阅者的消息处理方法。

目前使用较多的是广播机制的消息处理方式，且将topic与queue有效组合

一个生产消息的事件对应一个topic，topic下面可以挂多个queue，当然一个queue也可以挂在多个topic下面，每个queue都对应一个消息的消费端，唯一消费，保证消费的准确性。

如下图所示，当下单时，会将下单的相关信息封装到消息体中，发送到下单事件关联的那个topic1中，然后Topic会将消息复制发送到挂载在其下面的所有队列上，将Message复制到快照队列、成交记录统计队列中，消息端会监听队列，

如果有消息，则启动任务线程，来进行相关的业务处理。

在引入消息队列时重点要注意以下几点：

并发：选择的消息队列一定要很好地支持用户访问的并发性；
安全：消息队列是否提供了足够的安全机制；
性能伸缩：不能让消息队列成为整个系统的单一性能瓶颈；
部署：尽可能让消息队列的部署更为容易；
灾备：不能因为意外的错误、故障或其他因素导致处理数据的丢失，最好可以写入磁盘，持久化存储；
API易用性：处理消息的API必须足够简单、并能够很好地支持测试与扩展
容量：队列的容量一定要大，至少可以存储千万级别的消息体

目前市场上有很多成熟的消息框架：如Active MQ，IBM 的MQ，JBoss MQ，MSMQ等，各有各的优势，在使用前一定要充分衡量是否可以满足自己的业务需求

下图是napoli的client类图：

分布式设计与开发（二）------几种必须了解的分布式算法

分布式设计与开发中有些疑难问题必须借助一些算法才能解决，比如分布式环境一致性问题，感觉以下分布式算法是必须了解的（随着学习深入有待添加）：

Paxos算法
一致性Hash算法

Paxos算法

1）问题描述

分布式中有这么一个疑难问题，客户端向一个分布式集群的服务端发出一系列更新数据的消息，由于分布式集群中的各个服务端节点是互为同步数据的，所以运行完客户端这系列消息指令后各服务端节点的数据应该是一致的，但由于网络或其他原因，各个服务端节点接收到消息的序列可能不一致，最后导致各节点的数据不一致。举一个实例来说明这个问题，下面是客户端与服务端的结构图：

当client1、client2、client3分别发出消息指令A、B、C时，Server1~4由于网络问题，接收到的消息序列就可能各不相同，这样就可能由于消息序列的不同导致Server1~4上的数据不一致。对于这么一个问题，在分布式环境中很难通过像单机里处理同步问题那么简单，而Paxos算法就是一种处理类似于以上数据不一致问题的方案。

2）算法本身

算法本身我就不进行完整的描述和推导，网上有大量的资料做了这个事情，但我学习以后感觉莱斯利·兰伯特（Leslie Lamport，paxos算法的奠基人，此人现在在微软研究院）的Paxos Made Simple 是学习paxos最好的文档，它并没有像大多数算法文档那样搞一堆公式和数学符号在那里吓唬人，而是用人类语言让你搞清楚Paxos要解决什么问题，是如何解决的。这里也借机抨击一下那些学院派的研究者，要想让别人认可你的成果，首先要学会怎样让大多数人乐于阅读你的成果，而这个描述Paxos算法的文档就是我们学习的榜样。

言归正传，透过Paxos算法的各个步骤和约束，其实它就是一个分布式的选举算法，其目的就是要在一堆消息中通过选举，使得消息的接收者或者执行者能达成一致，按照一致的消息顺序来执行。其实，以最简单的想法来看，为了达到大伙执行相同序列的指令，完全可以通过串行来做，比如在分布式环境前加上一个FIFO队列来接收所有指令，然后所有服务节点按照队列里的顺序来执行。这个方法当然可以解决一致性问题，但它不符合分布式特性，如果这个队列down掉或是不堪重负这么办？而Paxos的高明之处就在于允许各个client互不影响地向服务端发指令，大伙按照选举的方式达成一致，这种方式具有分布式特性，容错性更好。

说到这个选举算法本身，可以联想一下现实社会中的选举，一般说来都是得票者最多者获胜，而Paxos算法是序列号更高者获胜，并且当尝试提交指令者被拒绝时（说明它的指令所占有的序列号不是最高），它会重新以一个更好的序列参与再次选举，通过各个提交者不断参与选举的方式，达到选出大伙公认的一个序列的目的。也正是因为有这个不断参与选举的过程，所以Paxos规定了三种角色（proposer，acceptor，和 learner）和两个阶段（accept和learn），三种角色的具体职责和两个阶段的具体过程就见Paxos Made Simple ，另外一个国内的哥们写了个不错的PPT ，还通过动画描述了paxos运行的过程。不过还是那句话不要一开始就陷入算法的细节中，一定要多想想设计这些游戏规则的初衷是什么。

Paxos算法的最大优点在于它的限制比较少，它允许各个角色在各个阶段的失败和重复执行，这也是分布式环境下常有的事情，只要大伙按照规矩办事即可，算法的本身保障了在错误发生时仍然得到一致的结果。

3）算法的实现

Paxos的实现有很多版本，最有名的就是google chubby ，不过看不了源码。开源的实现可见libpaxos 。另外，ZooKeeper 也基于paxos解决数据一致性问题，也可以看看它是如果实现paxos的。

4）适用场景

弄清楚paxos的来龙去脉后，会发现它的适用场景非常多，Tim有篇blog《Paxos在大型系统中常见的应用场景》专门谈这个问题。我所见到的项目里，naming service是运用Paxos最广的领域，具体应用可参考ZooKeeper

一致性Hash算法

1）问题描述

分布式常常用Hash算法来分布数据，当数据节点不变化时是非常好的，但当数据节点有增加或减少时，由于需要调整Hash算法里的模，导致所有数据得重新按照新的模分布到各个节点中去。如果数据量庞大，这样的工作常常是很难完成的。一致性Hash算法是基于Hash算法的优化，通过一些映射规则解决以上问题

2）算法本身

对于一致性Hash算法本身我也不做完整的阐述，有篇blog《一致性hash算法 - consistent hashing》描述这个算法非常到位，我就不重复造轮子了。

实际上，在其他设计和开发领域我们也可以借鉴一致性Hash的思路，当一个映射或规则导致有难以维护的问题时，可以考虑更一步抽象这些映射或规则，通过规则的变化使得最终数据的不变。一致性hash实际就是把以前点映射改为区段映射，使得数据节点变更后其他数据节点变动尽可能小。这个思路在操作系统对于存储问题上体现很多，比如操作系统为了更优化地利用存储空间，区分了段、页等不同纬度，加了很多映射规则，目的就是要通过灵活的规则避免物理变动的代价

3）算法实现

一致性Hash算法本身比较简单，不过可以根据实际情况有很多改进的版本，其目的无非是两点：

节点变动后其他节点受影响尽可能小
节点变动后数据重新分配尽可能均衡

实现这个算法就技术本身来说没多少难度和工作量，需要做的是建立起你所设计的映射关系，无需借助什么框架或工具，sourceforge上倒是有个项目libconhash ，可以参考一下

以上两个算法在我看来就算从不涉及算法的开发人员也需要了解的，算法其实就是一个策略，而在分布式环境常常需要我们设计一个策略来解决很多无法通过单纯的技术搞定的难题，学习这些算法可以提供我们一些思路。

0 0