1.CAP理论

  • 数据一致性(consistency):多个副本节点保持一致。
  • 服务可用性(availability):系统对外提供服务必须一致处于可用状态,在任何故障下,客户端都能在合理时间内获得服务端非错误的响应。
  • 分区容错性(partition-tolerance):在分布式系统中遇到任何网格分区故障,系统仍然能对外提供服务。网络分区,在分布式系统中,不同的节点分布在不用的子网格中,又可能子网格中只有一个节点,在所有网络正常的情况下,由于某些原因导致这些子节点之间的网络出现故障,造成整个节点环境被切分成了不同的独立区域,这就是网络分区。(简单的说:不同子网格 节点无法同步,但是还活着),分区容错性是现在分布式系统必然要考虑的问题。因此P必然存在,那就是AP和CP的抉择了。 | 选 择 | 说 明 | | —- | —- | | CA | 放弃分区容错性,加强一致性和可用性,其实就是传统的单机数据库的选择 | | AP | 放弃一致性(这里说的一致性是强一致性),追求分区容错性和可用性,这是很多分布式系统设计时的选择,例如很多NoSQL系统就是如此 | | CP | 放弃可用性,追求一致性和分区容错性,基本不会选择,网络问题会直接让整个系统不可用 |

需要明确的一点是,对于一个分布式系统而言,分区容错性是一个最基本的要求。因为 既然是一个分布式系统,那么分布式系统中的组件必然需要被部署到不同的节点,否则也就无所谓分布式系统了,因此必然出现子网络。而对于分布式系统而言,网 络问题又是一个必定会出现的异常情况,因此分区容错性也就成为了一个分布式系统必然需要面对和解决的问题。因此系统架构师往往需要把精力花在如何根据业务 特点在C(一致性)和A(可用性)之间寻求平衡

1.1 为啥只能满足2个条件?

如果满足AP,分隔的节点同时对外服务但不能相互通信,将导致状态不一致,即不能满足C;
如果满足CP,网络分区的情况下为达成C,请求只能一直等待,即不满足A;
如果满足CA,在一定时间内要达到节点状态一致,要求不能出现网络分区,则不能满足P。

在分布式系统中,通常只能满足AP和CP
Kafka 副本同步机制,采用HW的形式来保证数据一致性和服务可用性。

2.BASE 理论

BASE理论的核心思想是:即使无法做到强一致性,但每个应用都可以根据自身业务特点,采用适当的方式来使系统达到最终一致性
BASE理论是对CAP中一致性和可用性权衡的结果,其来源于对大规模互联网系统分布式实践的总结, 是基于CAP定理逐步演化而来的。

Basically Available 基本可用
Soft State 软状态
Eventually Consistent 最终一致性

1、基本可用
基本可用是指分布式系统在出现不可预知故障的时候,允许损失部分可用性——注意,这绝不等价于系统不可用。比如:
(1)响应时间上的损失。正常情况下,一个在线搜索引擎需要在0.5秒之内返回给用户相应的查询结果,但由于出现故障,查询结果的响应时间增加了1~2秒
(2)系统功能上的损失:正常情况下,在一个电子商务网站上进行购物的时候,消费者几乎能够顺利完成每一笔订单,但是在一些节日大促购物高峰的时候,由于消费者的购物行为激增,为了保护购物系统的稳定性,部分消费者可能会被引导到一个降级页面
2、软状态
软状态指允许系统中的数据存在中间状态,并认为该中间状态的存在不会影响系统的整体可用性,即允许系统在不同节点的数据副本之间进行数据同步的过程存在延时
3、最终一致性
最终一致性强调的是所有的数据副本,在经过一段时间的同步之后,最终都能够达到一个一致的状态。因此,最终一致性的本质是需要系统保证最终数据能够达到一致,而不需要实时保证系统数据的强一致性。

引用:

https://zhuanlan.zhihu.com/p/130332285
https://www.cnblogs.com/bangerlee/p/5328888.html
https://blog.csdn.net/u012240455/article/details/80842384