正确理解cap 理论

来源：互联网发布：鬣狗难过岔路口知乎编辑：程序博客网时间：2024/06/18 09:49

CAP 理论在搞分布式的程序员中已经是路人皆知了。但是 CAP 理论就好比是相对论，虽然所有的人都知道，但是却没有多少人真正理解。

要真正理解 CAP 理论必须要读懂它的形式化描述。形式化描述中最重要的莫过于对 Consistency, Availability, Partition-tolerance 的准确定义。

Consistency (一致性) 实际上等同于系统领域的 before-or-after atomicity 这个术语，或者等同于 linearizable (可串行化) 这个术语。具体来说，系统中对一个数据的读和写虽然包含多个子步骤并且会持续一段时间才能执行完，但是在调用者看来，读操作和写操作都必须是单个的即时完成的操作，不存在重叠。对一个写操作，如果系统返回了成功，那么之后到达的读请求都必须读到这个新的数据；如果系统返回失败，那么所有的读，无论是之后发起的，还是和写同时发起的，都不能读到这个数据。

要说清楚 Availability 和 Partition-tolerance 必须要定义好系统的故障模型。在形式化证明中，系统包含多个节点，每个节点可以接收读和写的请求，返回成功或失败，对读还要返回一个数据。和调用者之间的连接是不会中断的，系统的节点也不会失效，唯一的故障就是报文的丢失。 Partition-tolerance 指系统中会任意的丢失报文(这和“最终会有一个报文会到达”是相对的)。 Availability 是指所有的读和写都必须要能终止。

注： “Availability 是指所有的读和写都必须要能终止” 这句话听上去很奇怪，为什么不是“Availability 是指所有的写和读都必须成功”？要回答这个问题，我们可以仔细思考下“什么是成功”。“成功”必须要相对于某个参照而言，这里的参照就是 Consistency。

CAP 理论说在一个系统中对某个数据不存在一个算法同时满足 Consistency, Availability, Partition-tolerance 。注意，这里边最重要和最容易被人忽视的是限定词“对某个数据不存在一个算法”。这就是说在一个系统中，可以对某些数据做到 CP, 对另一些数据做到 AP，就算是对同一个数据，调用者可以指定不同的算法，某些算法可以做到 CP，某些算法可以做到 AP。

要做到 CP，系统可以把这个数据只放在一个节点上，其他节点收到请求后向这个节点读或写数据，并返回结果。很显然，串行化是保证的。但是如果报文可以任意丢失的话，接受请求的节点就可能永远不返回结果。

要做到 CA，一个现实的例子就是单点的数据库。你可能会疑惑“数据库也不是 100% 可用的呀？” 要回答这个疑惑，注意上面说的故障模型和 availability 的定义就可以了。

要做到 AP，系统只要每次对写都返回成功，对读都返回固定的某个值就可以了。

如果我们到这里就觉得已近掌握好 CAP 理论了，那么就相当于刚把橘子剥开，就把它扔了。

CAP 理论更重要的一个结果是，在 Partial Synchronous System (半同步系统) 中，一个弱化的 CAP 是能达到的:

* 对所有的数据访问，总返回一个结果
* 如果期间没有报文丢失，那么返回一个满足 consistency 要求的结果。

这里的半同步系统指每个节点存在一个时钟，这些时钟不需要同步，但是按照相同的速率流逝。更通俗的来说，就是一个能够实现超时机制的系统。

举个例子，系统可以把这个数据只放在一个节点上，其他节点收到请求后向这个节点读或写数据，并设置一个定时器，如果超时前得到结果，那么返回这个结果，否则返回失败。

更进一步的，也是最重要的，实现一个满足最终一致性 (Eventually Consistency) 和 AP 的系统是可行的。现实中的一个例子是 Cassandra 系统。

转自 http://www.douban.com/group/topic/11765014/

另一篇文章

CAP定理指在设计分布式系统时，一致性（Consistent）、可用性（Availability）、Partition Tolerance（分区容忍性）三个属性不可能同时满足，该定理也叫做布鲁尔定理。CAP定理明确了分布式系统所能实现系统的局限性，目前互联网中的很多分布式系统是基于首要满足可用性和分区容忍性而设计的。在这里，不打算提及目前火热的Cassandra、Voldemort等分布式存储系统，而是打算介绍一下CAP定理。

形式化描述
一致性：所有在分布式系统上的操作有一个总体上的顺序，每一个操作看起来就像是在一个单独的瞬间完成的。这就要求分布式系统的运行就像是在一个单节点上一样，在一个时间响应一个操作。

可用性：对于一个可用性的分布式系统，每一个非故障的节点必须对每一个请求作出响应。也就是，该系统使用的任何算法必须最终终止。当同时要求分区容忍性时，这是一个很强的定义：即使是严重的网络错误，每个请求必须终止。

分区容忍性：为了定义分区容忍性，假定网络满足如下条件：网络是可能丢失从一个节点发往另一个节点的任意消息，当网络被分区（隔断）时，所有从一个分区的节点发往另一个分区的消息将会丢失。一致性要求每个响应必须是一致的，即使系统内部的消息没有被正确地发送。可用性要求从客户端接收请求的任一节点必须被响应，即使任意的消息可能没有被正确地发送。

异步网络
在异步网络模型中，没有统一时钟，所有节点仅根据接收到的消息和本地的计算进行决策。
定理一：
在一个异步网络模型中，没有可能实现一个满足以下属性的读写数据对象：
1、可用性
2、一致性
对于所有对等运算（包括消息会丢失的）
证明：
假设存在一个算法A满足这些条件：一致性、可用性、分区容忍性。我们构造一次A的执行，包括一个返回非一致结果的请求。假设网络包含至少两个节点，那么它可以被分为不相关的非空集合：{G，H}。假设所有G和H之间的通讯消息都丢失，这是可能的。如果这时在G上有一个写操作，接着H上有一个读操作，那么读操作将无法返回早些的写操作。■
推论一：
在一个异步网络模型中，没有可能实现一个满足以下属性的读写数据对象：
1、可用性，所有对等运算
2、一致性，所有对等运算，但消息不会丢失
证明：
主要问题是在异步网络模型中一个算法没有办法去判断一个消息是否丢失或者在传输通道中被延迟。因此，如果在运算中不会丢失任何消息的前提下存在一个能够保证一致性的算法，那么该算法也能够在所有运算（消息可能丢失）情况下保证一致性。这将与定理一矛盾。■

部分同步网络
假设一个部分同步的网络模型，在这里，所有的节点都有一个时钟，并且所有的时钟以一个相同的速度增长。然而，这些时钟并不是同步的，在相同的时间，它们显示不同的时间值。事实上，时钟扮演计时器的角色：处理器可以根据本地状态变量去衡量流逝了多少时间。一个本地的计时器可以用来调度某事件之后的多长时间间隔进行另一个操作。进一步地，假设每一个消息要么在给定的时间s内到达，要么丢失。并且，所有的节点在给定时间t内处理完一个接收到的消息。
定理二：
在一个部分同步网络模型中，没有可能实现一个满足以下属性的读写数据对象：
1、可用性
2、一致性
对于所有对等运算（包括消息会丢失的）
证明：
证明方法与定理一一样。■
但是在部分同步模型中，类似与异步模型推论一的结论就不存在了，因此推论一的假设基于节点无法判断一个消息是否丢失。而在部分同步模型中，存在部分同步算法可以在所有消息传送正常的情况下返回一致性的数据，而仅仅在消息丢失时返回非一致性数据。对于读或写请求，节点发送一个消息给另一个节点，如果消息返回了，那么节点发送请求的数据；如果消息在给定的2s+t时间内没有返回，那么该节点断定消息丢失了，节点就可能返回一个不一致的请求数据。

理论参考价值
在Google使用廉价的PC机搭建了强大的、高可靠的计算和存储平台之后，互联网公司一致性地选择使用PC集群支撑全部的业务，这个理论指明了实现满足可用性、分区容忍性的分布式系统是可行的，并且该分布式系统在没有故障的情况下可以提供良好的一致性读写。

参考
Lynch, Nancy, and Seth Gilbert. “Brewer's conjecture and the feasibility of consistent, available, partition-tolerant web services.” ACM SIGACT News, v. 33 issue 2, 2002, p. 51-59.