Java常见技术分享-分布式篇-分布式系统基础理论

CAP 和 BASE

CAP定理
- CAP定理就是说在分布式系统中, P(从跨度时间长的维度上看必然发生)发生时， C和A只能保证一个，而不是三选二。
  - CP系统当网络分区发生时，节点之间无法同步数据，为了保证数据一致，系统会拒绝部分请求，变得不可用。
  - AP系统当网络分区发生时，节点之间无法同步数据，为了继续提供服务允许不同分区可能返回不同的数据，无法保证数据一致。
- C
  - 一致性指的是一旦数据更新，所有节点立即能看到最新数据，就像单机数据库，一个事务提交后其他的事务立即能拿到最新值。
- A
  - 可用性不管系统内部是否有故障，只要用户发起请求，系统必须在合理的时间范围内返回结果，不能让客户一直等待或返回错误。
- P
  - 分区容错性分布式系统部署在多个节点，节点间依靠网络进行通信，所谓分区指的是网络分区，假如说有A，B两个节点，原本是能互相通信的，但是现在无法通信了， A发消息B接收不到，我们就说他们之间分区了，而容错性就是在网络出现分区的时候，系统仍然能正常运行不会出现直接崩溃的情况。
BASE理论
- B 是 Basically available 基本可用
- S. 是 Soft State 软状态
- E 是 Eventually Consistency 最终一致性
- 这三者之间存在一个逻辑上的递进关系
  - 为了实现基本可用 （目标），系统必须接受一个现实，数据在不同的节点间同步会有延迟。
  - 这个延迟导致了 软状态 （代价）即系统内部允许存在短暂的不一致。
  - 但系统承诺这种不一致是暂时的（最终一致性），最终所有数据都会同步，达到最终一致性。

场景

支付、交易系统：通常选择CP，钱绝对不能出错，哪怕有时无法支付。
社交网络、内容发布：通常选择AP，刷不出新的动态比网络崩溃更容易接受。

现代分布式系统的设计，本质上都是在CAP 这个铁律之下，通过各种精巧的技术如BASE理论，共识算法，多副本策略来管理优化和弱化这种权衡带来的影响，但永远无法从根本上消除他。

总结来说， CAP定理的 "一定性" 来源于：网络故障的必然性 + 逻辑上的互斥性。不是一个需要被推翻的假设，而是一个必须接受、并在此基础上进行工程设计的客观规律。