vlambda博客
学习文章列表

分布式架构之「 CAP理论」

CAP理论是由Eric Brewer提出的分布式系统中最为重要的理论之一。这里将CAP理论放在最后一篇文章,是为了利用前面介绍过几种分布式协议来帮助理解CAP理论


定义


CAP理论的定义很简单,CAP三个字母分别代表了分布式系统中三个相互矛盾的属性: 


Consistency(一致性):CAP理论中的副本一致性是指强一致性; 


Availiablity(可用性):指系统再出现异常时仍然可用提供服务; 


Tolerance to the partition of network(分区容忍):指系统可以对网络分区这种异常情况进行容错处理; 


CAP理论指出:无法设计一种分布式协议,使得同时完全具备CAP三个属性

1)该种协议下的副本始终是强一致性,

2)服务始终是可用的,

3)协议可以容忍任何网络分区异常;

分布式系统协议只能在CAP这三者间有所折中。 


CAP理论的详细证明可以参考相关的论文。这里可以简单用一个反例证明不存在CAP兼具的系统。假设系统只有两个副本A和B,Client更新这两个副本,假设在网络分化时,Client与副本A可以正常通信,但副本B与Client、副本B与副本A无法通信,此时,Client对副本A更新的信息永远无法同步到副本B上。如果希望系统依旧具有强一致性的属性,则此时需要停止更新服务,即不再修改数据,从而让副本A与副本B保持一致;如果希望系统依旧可以提供更新服务,则只能更新副本A而无法更新副本B,此时无法保证副本A与副本B的一致


CAP理论的意义


热力学第二定律说明了永动机是不可能存在的,不要去妄图设计永动机。与之类似,CAP理论的意义在就在于明确提出了不要去妄图设计一种对CAP三大属性都完全拥有的完美系统,因为这种系统再理论上就已经被证明不存在


协议分析


介绍的几种分布式协议是如何在CAP三大属性中做折中与取舍的。在前面介绍的典型分布式系统时,也会用CAP理论对这些系统的分布式协议进行分析。 介绍的几种分布式协议是如何在CAP三大属性中做折中与取舍的。在前面介绍的典型分布式系统时,也会用CAP理论对这些系统的分布式协议进行分析。


Lease机制


Lease机制牺牲了部分异常情况下的A,从而获得了完全的C与很好的P。 


上面这句话有点抽象,下面一一解释。首先Lease机制不是在任何情况下都具有可用性的,使用Lease机制的协议,在发生异常时,需要等待Lease超时才能收回Lease权限。然而,Lease的持有者可能在Lease超时前就已经出现异常而不能提供服务了,直到Lease超时这段时间内,系统服务的可用性都有问题。例如,如果用Lease决定primary副本的,primary副本节点宕机后,只有待Lease超时才能选出新的primary副本,这段时间由于缺乏primary副本是没有更新服务的。再者,Lease协议本身保证了对于Lease约定的承诺在Lease颁发者和持有者之间是始终一致的。即使Lease持有者由于网络分化没有真正受到LeaseLease颁发者也会在Lease时间内执行自己的承诺;而一旦Lease持有者收到Lease,则即使再出现网络分化,也无法影响双方对Lease承诺理解的一致性。最后,Lease协议引入了”时间“这一概念,使得在对抗网络分化上有其特别的优势,另外,Lease只需要颁发者向持有者通信,即使网络是单向的也不影响Lease协议的正常工作。


Quorum机制 


这里仅讨论一般的Quorum机制,即总共有N个副本,成功更新W个副本则算成功提交,读取时读R个副本。这种一般的Quorum机制,在CAP三大因素中都各做了折中,有一定的C,有较好的A,也有较好的P,是一种较为平衡的分布式协议。


首先,读取R个副本时,可以保证读取到成功提交的版本,但无法保证读取到最新的成功提交的版本。也就是说,系统具有一定的一致性,却无法真正的做到强一致性。再者,无论是更新W个副本,还是读取R个副本,协议可以允许部分副本异常而不影响更新或者读取服务。最后,只要能与W个副本通信就可以提供更新服务,能与R个副本通信就可以提供读服务,协议具有一定的容忍网络分化的能力。工程中,当使用3个副本时,可以讲三个副本部署三个不同的机房,只有同时出现两个机房的网络都异常时才会影响服务,这种情况的概率本身已经非常低了。 


两阶段提交协议


两阶段提交系统具有完全的C,很糟糕的A,很糟糕的P。 


首选,两阶段提交协议保证了副本间是完全一致的,这也是协议的设计目的。再者,协议在一个节点出现异常时,就无法更新数据,其服务可用性较低。最后,一旦协调者参与参与者直接网络分化,就无法提供服务。 


paxos协议 


同样是强一致性协议,Paxos在CAP三方面较之两阶段提交协议要优秀得多。Paxos协议具有完全的C,较好的A,较好的P。Paxos的A与P的属性与Quorum机制类似,因为Paxos的协议本身就具有Quorum机制的因素。 


首先,无需赘述,Paxos协议是一种强一致性协议。再者,Paxos协议只有两种情况下服务不可用:一是超过半数的Proposer异常,二是出现活锁。前者可以通过增加Proposer的个数来降低由于Proposer异常影服务的概率,后者本身发生的概率很低。最后,只要与超过半数的Proposer通信就可以完成协议流程,协议本身具有较好的容忍网络分区的能力。








开放、分享、协作

好看|求转发