一、CAP理论
C:强一致性。 在分布式系统中各个节点之间,数据保持同步,在同步过程中,不能对外提供服务,否则就达不到强一致性的效果,必然会有数据不一致的情况出现。
强一致性特点: 1.同步过程一定是对资源加锁,同步完成后才释放锁。保证数据的强一致性。 2.在数据同步过程中,一定不能获取到旧数据,要么等待锁释放,获取新数据,要么直接报错。
举例:
在一个mysql数据库读写分离的项目架构中,写入数据进A数据库。读取数据用B数据库。A数据库与B数据库进行数据同步。如果保持强一致性,则A库写入新数据后,对A和B数据库同时进行加锁,然后进行数据同步。等数据同步完成后,释放锁,然后程序才能在B数据库读取成功数据。
A:可用性 用户发出请求后,不能返回报错信息或超时信息。必须返回所需数据。这就是可用性。
由此可见,C和A是互斥的。要想保证C,那么就要加锁,等待数据同步完成后,再对外提供服务。这样做的后果就是数据同步期间服务对外不可用,不能满足A。要想满足A,那就数据同步的时候不加锁,服务依然对外可用。这样就不满足C了。 所以,C和A,只能满足一个。
举例:还是读写分离的数据库。如果满足可用性,则数据写入A数据库后,不管数据是否同步到了B数据库。程序在读B数据库时,都会获取到数据。即使获取的数据为空或者为旧数据,都可以。这就是可用性。
P:分区容错性 分区容错性指分布式系统中某个节点挂掉后,或节点间因网络异常无法通信了,对外提供服务不能受到影响。不能因为某个节点挂了而导致整个项目无法运行了。
分布式系统中,必须保证P。C和A保证哪个,需要自己做取舍。 AP组合: 放弃强一致性。从而达到可用性。这个方案目前是采用最多的方案。放弃强一致性,达到最终一致性。即在数据同步过程中,获取到的数据是不一致的,但是等数据同步完成后,获取到的数据就是一致的。 例如退款操作。进入申请退款,明天钱才到账。这就是数据同步的过程,保证了可用性和数据最终一致性,而不是强一致性。
CP组合: 放弃可用性,保证强一致性。 例如,跨行转账,只有两边银行同时操作成功,才算成功,这就是强一致性。哪怕返回错误,服务不可用,也要保证钱的一致性。
二、BASE理论
上面提到CAP理论只能满足C和A之间的一个。所以大部分系统采用了实现CP来设计分布式系统。BASE理论就是针对CP理论的一个扩展。在CP的基础上,更进一步优化分布式系统。
BA:表示基本可用,允许一定程度的不可用。比如由于系统故障,请求时间变长,或者由于系统故障导致部分非核心功能不可用,都是允许的。
S:表示中间状态,比如,数据不同步,但是正在同步,这段期间,就是中间状态。
E:最终一致性。不要求数据实时同步,但最终数据是同步一致的。在达到一致的过程中,系统也是可用的。
可见,BASE理论就是合理化的解释了AP。这只是理论,具体的实现方式,不同的框架,有不同的实现方式。以后看到了要知道是应用的这个理论。
|