分布式一致性（六）：拥抱可用性 —— 最终一致性与 Gossip 协议

前言

前两篇我们深入了 Raft 和 ZAB------两个强一致性协议的典型代表。它们的共同特征是：写入必须经过多数派确认，任何节点在任何时刻读到的都是最新的数据。

但这种"强"是有代价的：

延迟高：每次写操作都要等网络往返 + 多数派确认，在广域网（WAN）环境下延迟动辄数百毫秒。
可用性受损：超过半数节点故障则系统不可写，CAP 定理的 A 被牺牲。
扩展性有限：节点越多，多数派门槛越高，协调开销越大。

现实世界中有大量场景并不需要这么"强"------用户上传的一张照片，稍晚几秒同步到所有机房并无大碍；购物车的商品可以暂时在不同设备上不一致；社交媒体的点赞数差几个完全可以接受。

这类场景的设计哲学，就是今天的主角：最终一致性（Eventual Consistency）。

一、Quorum NWR：一致性的调节旋钮

在第三篇中，我们推导了 Quorum 机制：W + R > N 时，写入集合与读取集合必然有交集，最新数据不会丢。

这个公式其实是一个可自由调节的旋钮，通过改变 W 和 R 的值，可以在强一致性和高可用性之间任意滑动：

配置	W	R	特点
`W=N, R=1`	全量	1	写必须所有节点确认；读只需一个节点。写极慢（任意节点故障则写失败），读极快
`W=1, R=N`	1	全量	写一个节点即返回；读所有节点取最新。写极快，读极慢
`W=N/2+1, R=N/2+1`	多数派	多数派	Raft / ZAB 的模式。强一致，延迟中等
`W=1, R=1`	1	1	写读都只需一个节点。速度极快，不保证一致性（W+R≤N，无交集）

💡 W + R > N 是强一致的分水岭

W + R > N ：写入集合与读取集合必然有交集，读一定能看到最新的写入，读己之写（Read-your-writes） 得到保证。

W + R ≤ N ：没有交集保证，读可能读到旧数据。但换来的是极高的写入速度和可用性，即最终一致性场景。

典型配置：W=1 的极速写入

电商大促时，用户每次浏览商品，系统都要记录一条"浏览行为"日志用于推荐算法。这类数据的特点是：

写入量巨大（每秒数百万次）。
允许丢失极少量数据（偶尔漏记一次无影响）。
不需要强一致性（推荐算法基于统计，偶尔有延迟无所谓）。

此时将 W 设为 1------只要一个副本收到写入就立刻返回，其余副本异步复制。写入延迟从"等多数派"降到"等最近的一个节点"，吞吐量提升数倍。vc0ejki.

代价是：如果这唯一一个副本在数据还没同步出去时宕机，这条记录就丢了。商业上接受这个风险，换来了工程上的巨大吞吐收益。

好，现在问题来了：W=1 时，数据只写入了一个节点，其他副本怎么知道要同步？这就需要一个机制，在没有中心协调者的情况下，把数据扩散到所有节点。

这个机制，就是 Gossip 协议。

二、Gossip 协议：病毒式的信息扩散

Gossip 协议的灵感来自流行病学------就像流感在人群中传播一样，信息在节点之间"感染"扩散。它是最终一致性系统的"神经系统"，被 Redis Cluster 、Nacos （AP 模式的 Distro 协议）等大量系统广泛采用，Cassandra 也是其在存储层的经典实现。

Gossip 有三个核心特性，贯穿它的所有具体实现：

去中心化：没有 Leader，任何节点都可以发起传播，没有单点瓶颈。
自愈性：节点宕机只影响它自己，其他节点继续传播，不会阻塞整体收敛。
概率性收敛 ：不能保证某个具体时间点所有节点都收到，但以极高概率在 O(log N) 轮内完成扩散。

工程实现中，Gossip 分为两种运作模式，分工明确：

Rumor Mongering（谣言传播）负责新消息的快速扩散。
Anti-Entropy（反熵）负责周期性兜底补齐。

graph TD classDef ae fill:#e3f2fd,stroke:#1e88e5,stroke-width:2px,color:#333 classDef rm fill:#f3e5f5,stroke:#8e24aa,stroke-width:2px,color:#333 classDef both fill:#e8f5e9,stroke:#43a047,stroke-width:2px,color:#333 subgraph RM ["📢 Rumor Mongering（谣言传播）------ 新消息立即扩散，快"] RM1["节点收到新消息后，立即随机通知邻居"]:::rm RM2["邻居继续传播，直到所有节点知道"]:::rm RM1 --> RM2 end subgraph AE ["🔁 Anti-Entropy（反熵）------ 周期性全量对比，准"] AE1["定期与随机邻居做全量状态比对"]:::ae AE2["找出差异，互相补全缺失数据"]:::ae AE1 --> AE2 end RM -->|"新消息秒级扩散"| R["✅ 最终一致"]:::both AE -->|"消除残余不一致"| R style RM fill:#fafafa,stroke:#ce93d8,stroke-width:2px,stroke-dasharray:5 5 style AE fill:#fafafa,stroke:#90caf9,stroke-width:2px,stroke-dasharray:5 5

Rumor Mongering（谣言传播）

当节点 A 收到一条新写入数据时，立刻随机选几个邻居传播，收到消息的邻居再继续随机传播，像谣言一样病毒式扩散：

sequenceDiagram autonumber participant A as 节点A(源头) participant B as 节点B participant C as 节点C participant D as 节点D participant E as 节点E %% 使用 rgb(r,g,b) 设置第一阶段的背景色为淡蓝色 rect rgb(235, 243, 252) Note over A,E: 🔵 【Round 1】 A 收到新数据，随机向 B 和 C 发起同步 activate A par A 传播给 B A->>+B: 同步数据 (Gossip) and A 传播给 C A->>+C: 同步数据 (Gossip) end deactivate A end Note over B,C: 此时 A, B, C 均已持有最新数据 %% 使用 rgb(r,g,b) 设置第二阶段的背景色为淡绿色 rect rgb(238, 248, 235) Note over A,E: 🟢 【Round 2】被感染的 B 和 C 继续向下随机传播 par B 传播给 D B->>+D: 同步数据 (Gossip) and C 传播给 E C->>+E: 同步数据 (Gossip) end deactivate B deactivate C end Note over A,E: ✅ 仅需 2 轮，集群所有 5 个节点达到最终一致性 deactivate D deactivate E

为什么这么快？借用流行病学的传播模型来直观理解：

ini 复制代码

假设 N=1000 个节点，每轮每个"已感染"节点随机通知 3 个邻居

Round 0：  1 个节点知道消息
Round 1：  1 × 3 + 1  ≈ 4   个节点知道
Round 2：  4 × 3       ≈ 16  个节点知道
Round 3：  16 × 3      ≈ 64  个节点知道
Round 4：  64 × 3      ≈ 256 个节点知道
Round 5：  256 × 3     ≈ 768 个节点知道（已趋近全量）

5 轮 ≈ log₄(1000) ≈ 5 ✅（后期因重叠节点增多实际会慢一点）

每一轮"感染"节点数指数级增长------这就是 O(log N) 收敛的直觉来源。相比 Leader 广播需要逐一通知所有节点的 O(N) 开销，Gossip 的扩展性极强。

但 Rumor Mongering 不保证每个节点一定收到（消息可能因网络抖动丢失），这就需要 Anti-Entropy 来兜底。

Anti-Entropy（反熵）

💡 "熵"在物理学中代表系统的混乱程度。Anti-Entropy（反熵）就是"对抗混乱"------定期发现并消除节点之间的不一致。

每隔一个固定周期（如 1 秒），节点 A 随机选一个节点 B，交换彼此的数据摘要，找出差异，补齐对方缺少的数据。即使某条消息在 Rumor Mongering 阶段因网络抖动漏传，Anti-Entropy 最终也会把它补过去。

实际工程中，为了避免全量数据对比的开销，Cassandra 等系统使用 Merkle Tree（默克尔树） 做高效差异检测：

scss 复制代码

Merkle Tree：用哈希值表示数据子集的"指纹"

         Hash(ABCD)            ← 根哈希：整个数据集的指纹
        /            \
   Hash(AB)        Hash(CD)    ← 子树哈希
   /       \       /      \
Hash(A) Hash(B) Hash(C) Hash(D) ← 叶子：单条数据的哈希

对比两节点的 Merkle Tree：
  根哈希相同 → 数据完全一致，直接跳过
  根哈希不同 → 逐层向下定位差异，最终精确到不一致的数据项

时间复杂度：O(差异数量 × log N)，远优于全量扫描

⚠️ 工程实践中二者缺一不可：Rumor Mongering 负责"快"，Anti-Entropy 负责"准"。Cassandra 就是这种组合------新数据写入后立即触发 Gossip 传播，同时定期跑 Anti-Entropy 修复遗漏。

三、最终一致性的隐患：并发冲突

Gossip 解决了"如何传播 "的问题，但还有一个更棘手的问题：如果两个节点同时收到了针对同一条数据的不同写入，最终谁覆盖谁？

css 复制代码

场景：用户 Alice 的购物车，N=3 副本，W=1

时刻 T1（并发发生）：
  Alice 在北京的设备 → 节点 A 写入：添加"手机壳"→ 购物车 = {手机壳}
  Alice 在上海的设备 → 节点 C 写入：添加"耳机"   → 购物车 = {耳机}

W=1，两次写入各自立即返回成功。

Gossip 同步后：
  节点 A 收到来自 C 的版本 {耳机}
  节点 C 收到来自 A 的版本 {手机壳}

问题：节点 A 现在有两个版本的购物车。哪个是"正确的"？该保留哪个？

这就是并发冲突（Concurrent Conflict）。

解决冲突之前，必须先回答一个更基本的问题：这两次写入，到底是"一个发生在另一个之后"，还是"互相不知道对方存在的并发写入"？ 这两种情况的处理方式截然不同：

因果先后：Alice 先写了"手机壳"，看到后又改成了"耳机"------后者知道前者的存在，直接用新版本覆盖旧版本就行，没有冲突。
真正并发：两台设备同时独立写入，互相不知道对方------没有谁"更对"，必须由系统或业务来决定如何合并。

所以冲突处理的第一步，是准确区分这两种情况。最直觉的想法是比较时间戳------谁写得晚谁"赢"。但分布式系统里没有全局时钟，各节点的物理时钟存在偏差，靠物理时间戳判断先后并不可靠。

那用逻辑时钟呢？Lamport 时间戳 正是为此设计的------每次事件发生时递增计数，通信时把时间戳同步给对方。但它有一个致命盲点，只能证明"事件 A 一定在事件 B 之前"，却无法判断"事件 A 和事件B 是否并发"：

css 复制代码

节点A 的 Lamport 时间戳：5
节点C 的 Lamport 时间戳：3

能得出"A 的写入一定发生在 C 之后"吗？不能！
A=5、C=3 可能只是因为 A 本地事件更多，而两者根本没有通信过。
两次写入完全独立，是并发关系------但 Lamport 时间戳看不出来。

Lamport 时间戳是一个全局单调递增的数字，丢失了"哪个节点做了什么"的信息，无法重建节点之间的因果图。

四、向量时钟（Vector Clock）

向量时钟正是针对 Lamport 时间戳的这个缺陷设计的。解法很直接：既然一个全局数字丢失了节点维度的信息，那就为每个节点单独维护一个计数器，把所有节点的计数器组合成一个向量随数据一起传播。这样，因果关系就被完整编码进了向量的形状里。

原理：

向量时钟为每个节点分配一个独立的计数器，形成一个向量：

ini 复制代码

3 节点集群（A、B、C），初始状态：
  VC_A = [A:0, B:0, C:0]
  VC_B = [A:0, B:0, C:0]
  VC_C = [A:0, B:0, C:0]

三条核心规则：

节点本地发生事件（如写入数据），自己的计数器 +1。
节点发送消息时，附带自己当前的向量时钟。
节点收到消息时，对向量的每个分量取 max，再对自己的计数器 +1。

如何判断因果关系：

css 复制代码

若 VC_a 的每个分量都 ≤ VC_b 的对应分量（且至少一个严格 <）：
  → "a 发生在 b 之前"（happens-before），因果关系明确

若 VC_a 和 VC_b 既不满足 VC_a ≤ VC_b，也不满足 VC_b ≤ VC_a：
  → "a 和 b 是并发的"，存在冲突，需要解决

来看购物车冲突的完整向量时钟推演：

sequenceDiagram autonumber actor 购买者 participant A as 节点 A (北京) participant C as 节点 C (上海) Note over A,C: 初始状态：VC_A = [A:0, C:0]，VC_C = [A:0, C:0] rect rgb(255, 245, 230) par 购买者在北京写购买者->>A: 写 "手机壳" Note over A: A 计数器 +1
VC_A → [A:1, C:0] and 购买者在上海写 (与 A 并发) 购买者->>C: 写 "耳机" Note over C: C 计数器 +1
VC_C → [A:0, C:1] end end rect rgb(235, 245, 255) Note over A,C: Gossip 同步：A 与 C 互换数据 A->>C: 发送数据={手机壳}, VC=[A:1, C:0] C->>A: 发送数据={耳机}, VC=[A:0, C:1] end rect rgb(255, 235, 235) Note left of A: 收到 C 的 VC=[A:0,C:1]，自己 VC=[A:1,C:0]
A[0]=1 > C[0]=0，但 A[1]=0 < C[1]=1
👉 互不包含，并发冲突！⚠️ Note right of C: 收到 A 的 VC=[A:1,C:0]，自己 VC=[A:0,C:1]
C[1]=1 > A[1]=0，但 C[0]=0 < A[0]=1
👉 互不包含，并发冲突！⚠️ end

向量时钟准确地告诉我们：这两次写入是并发的，没有因果关系。接下来必须由系统或业务层来决定如何处理。

五、冲突解决：三种策略

检测到冲突后，需要一种策略来解决它。主流方案有三种，各有取舍。

策略一：Last Write Wins（LWW）

最简单粗暴：以物理时间戳最新的写入为准，丢弃旧的。

css 复制代码

节点 A 的写入时间戳：13:00:01.003（写"手机壳"）
节点 C 的写入时间戳：13:00:01.001（写"耳机"）

LWW：保留"手机壳"，丢弃"耳机" ← 耳机无声消失了！

优点：实现简单，无需业务逻辑干预。

缺点：数据丢失。并发写入中"输"的那一方数据直接消失，用户可能毫不知情。

适用场景 ：时间序列数据（新值天然覆盖旧值）、日志类数据。Cassandra 默认采用 LWW。不适合购物车、文档协同这类"写入需要合并"的场景。

策略二：多版本保留 + 读时合并

不做取舍------把两个冲突版本都保存下来，读取时把所有冲突版本一起返回给客户端，由业务代码决定如何合并：

ini 复制代码

购物车冲突版本：
  版本 v1（来自 A，VC=[A:1,C:0]）：{手机壳}
  版本 v2（来自 C，VC=[A:0,C:1]）：{耳机}

读取时同时返回 v1 和 v2
→ 业务代码合并：取并集 → {手机壳, 耳机}
→ 以合并后的版本写回（VC 更新为 [A:1,C:1]）

优点：不丢数据，合并逻辑由业务灵活定义。

缺点：客户端必须实现冲突合并逻辑，增加应用复杂度。Amazon DynamoDB 和 Riak 均采用这种方式（称为"Siblings"兄弟版本）。

策略三：CRDT（无冲突复制数据类型）

最优雅的方案：CRDT（Conflict-free Replicated Data Type），从数据结构设计层面，让合并操作天然满足交换律和结合律，永远不产生需要人工干预的冲突。

以最简单的 G-Counter（只增计数器） 为例：

css 复制代码

场景：统计全局点赞数，3 个节点各自独立记录本地增量

节点 A：[A:3, B:0, C:0]  （A 统计到了 3 个点赞）
节点 C：[A:0, B:0, C:5]  （C 统计到了 5 个点赞）

合并规则：逐分量取 max
合并结果：[A:3, B:0, C:5]
总点赞数：3 + 0 + 5 = 8

无论先合并 A→C 还是 C→A，无论合并多少次，结果始终是 8 ✅

CRDT 的典型种类：

javascript 复制代码

G-Counter   → 只增计数器（点赞数、访问量）
PN-Counter  → 可增减计数器（库存量）
OR-Set      → 安全支持删除的集合（购物车）
LWW-Register → 最后写入获胜的寄存器（用户配置项）

优点：完全无冲突，收敛有数学保证，业务层无需处理冲突。

缺点：只适用于特定的数据类型，并非所有业务场景都能建模为 CRDT（比如"余额不能为负"这类约束就无法用纯 CRDT 表达）。

graph TD classDef lww fill:#ffebee,stroke:#e53935,stroke-width:2px,color:#333 classDef mvv fill:#fff8e1,stroke:#ffb300,stroke-width:2px,color:#333 classDef crdt fill:#e8f5e9,stroke:#43a047,stroke-width:2px,color:#333 classDef q fill:#f3f3f3,stroke:#bdbdbd,stroke-width:1px,color:#555 Q["⚠️ 检测到并发冲突"]:::q Q --> LWW["LWW：时间戳最新者胜
─────────────
✅ 实现简单
❌ 有数据丢失风险"]:::lww Q --> MVV["多版本保留 + 读时合并
─────────────
✅ 不丢数据
❌ 业务层需处理合并"]:::mvv Q --> CRDT["CRDT：数学级免冲突
─────────────
✅ 自动收敛
❌ 适用场景有限"]:::crdt

六、选型全景：强一致 vs 最终一致

走到这里，我们已经把一致性光谱的两端都探索过了：

graph LR classDef strong fill:#ffebee,stroke:#e53935,stroke-width:2px,color:#333 classDef eventual fill:#e8f5e9,stroke:#43a047,stroke-width:2px,color:#333 classDef mid fill:#fff8e1,stroke:#ffb300,stroke-width:2px,color:#333 subgraph 强 ["🔒 强一致性"] S1["Raft / ZAB
W=多数派, R=多数派
写延迟高，不丢数据"]:::strong end subgraph 中 ["⚖️ 可调一致性"] M1["Cassandra / DynamoDB
NWR 可配置
灵活取舍"]:::mid end subgraph 终 ["🌊 最终一致性"] E1["Gossip + W=1
冲突通过 LWW / CRDT 解决
写极快，允许短暂不一致"]:::eventual end 强 -->|"提高可用性"| 中 -->|"继续放宽"| 终 style 强 fill:#fafafa,stroke:#ef9a9a,stroke-width:2px,stroke-dasharray:5 5 style 中 fill:#fafafa,stroke:#ffe082,stroke-width:2px,stroke-dasharray:5 5 style 终 fill:#fafafa,stroke:#a5d6a7,stroke-width:2px,stroke-dasharray:5 5

简单的选型参考：

场景特征	推荐方向
数据不能丢、不能错（金融账本、配置中心、分布式锁）	强一致（Raft / ZAB）
集群规模小（3~7 节点），多数派延迟可接受	强一致
写入量极大（行为日志、IoT 传感器数据）	最终一致（W=1 + Gossip）
全球多活部署，WAN 延迟不可避免	最终一致或可调一致
数据类型可建模为 CRDT（计数器、集合）	CRDT + 最终一致
数据类型适合"新值覆盖旧值"（时序数据）	LWW + 最终一致

总结

本篇从强一致性的代价出发，完整探索了最终一致性的核心机制：

Quorum NWR：W + R > N 是强一致的分水岭。W=1 换来极速写入，以最终一致性为代价。调节 W 和 R，本质是在读写延迟与数据一致性之间做工程取舍。

Gossip 协议：去中心化的信息传播机制。Rumor Mongering 负责新消息的快速扩散（O(log N) 轮收敛），Anti-Entropy 定期全量比对兜底（借助 Merkle Tree 高效定位差异）。两者组合，是最终一致性系统的"神经系统"。

并发冲突：最终一致性的必然代价。向量时钟精确检测哪些写入是并发的，为冲突解决提供依据。

冲突解决三策略：LWW 简单但有数据丢失风险；多版本保留把决策权还给业务层；CRDT 从数据结构层面消灭冲突，是最优雅但也最受约束的方案。

强一致性和最终一致性没有绝对的好坏，只有是否适合当前场景的取舍。两者的数学根基都是第三篇的 Quorum 交集定律------只是在 W、R、N 上拨动了不同的旋钮。

下篇预告：

经过前六篇的理论深耕，我们已经掌握了分布式一致性的完整光谱：从强一致的 Raft/ZAB，到灵活可调的 NWR，再到最终一致的 Gossip + CRDT。

最后一篇，我们将以架构视角收尾：如何在实际项目中选型------Etcd、ZooKeeper、Nacos 三者横评；Multi-Raft 如何突破单机承载上限；以及运维视角下各系统的隐性成本。理论落地，是为终章。

思考题

Gossip 的收敛是"概率性"的，不能 100% 保证所有节点在某个时刻前都收到消息。在实际系统中，如何弥补这个"不确定性"带来的风险？

参考答案
多层防御机制的组合：

1. Anti-Entropy 兜底 ：Rumor Mongering 阶段可能遗漏个别节点（网络抖动、消息丢失），Anti-Entropy 定期全量对比并补齐差异，是最核心的兜底手段。只要周期足够短（如 Cassandra 每小时一次），数据最终一定会同步到所有节点。

2. 读时修复（Read Repair） ：客户端读取数据时，系统同时查询多个副本，对比版本，发现落后的副本立刻补写。每次读操作都是一次"顺手"的修复机会，不需要额外的后台任务。

3. 提高扇出（Fanout） ：每次 Gossip 联系更多邻居（增大 k），收敛速度更快，漏传概率更低，代价是网络开销增加。工程上通常选 k=2~3 作为平衡点。

总结：没有任何单一机制能 100% 消除不确定性，但"Rumor Mongering（快速扩散）+ Anti-Entropy（兜底补齐）+ Read Repair（读时修复）"的三层组合，在工程上已经足够可靠，Cassandra 和 DynamoDB 都是这套组合的典型实践。

向量时钟的一个已知缺点是"时钟向量会随节点数增长而膨胀"。Amazon Dynamo 论文就记录了这个问题。实际系统是如何解决的？

参考答案
主要方案：时钟截断（Clock Truncation）

先看膨胀是怎么发生的。普通向量时钟每个条目只有 (节点ID, 计数器)，但 Dynamo 在每个条目里额外附加了一个物理时间戳，记录这个节点最后一次参与写入的时间：

复制代码

VC = [
  (节点A, 计数器=5, 最后更新=13:00:01),
  (节点B, 计数器=3, 最后更新=12:58:44),
  (节点C, 计数器=7, 最后更新=10:22:03),
  ... 随着写入节点增多，条目不断增加
]

当条目数超过阈值（Dynamo 默认 10 个）时，直接删掉物理时间戳最老的那个条目------也就是最久没参与过写入的节点的记录。

代价：被删条目的因果信息丢失，系统之后可能把本来有因果关系的两个版本误判为"并发"，触发不必要的合并。实践中这被认为可以接受------误判只是多做一次业务合并，数据本身不会丢失。

替代方案 ：Riak 选择了更紧凑的编码变体------Dotted Version Vectors，通过更精确的结构减少向量膨胀，同时保持完整的因果追踪能力。

总结：截断是工程上的务实妥协------当存储成本和精确因果追踪发生冲突时，保留"足够好"的准确性，同时控制资源开销。完美的因果追踪在大规模系统中本身就是奢侈品。

CRDT 中的 OR-Set（可观察删除集合）是如何解决"并发添加和删除同一元素"这个经典冲突的？

参考答案
核心思路：给每次添加打"唯一标签"，删除时只删特定标签，而非元素本身。

问题背景 ：普通集合中，并发的"添加 A"和"删除 A"同时发生时，该留着还是删掉？两种选择都有合理性，没有统一答案。

OR-Set 的解法 ：

添加元素时，为这次操作生成一个全局唯一 ID（UUID）。集合内部实际存储 （元素值, UUID） 对，例如 （A, uuid-123）。
删除元素时，只删除本节点当前可见的所有 （A, *） 条目（即已知的所有 UUID）。
如果另一个节点在删除发生时并发添加了同一个 A（生成了新的 uuid-456），这个 （A, uuid-456） 不在被删范围内，自然保留下来。

结果：并发的"添加 A"和"删除 A"之后，A 依然在集合中------因为删除只作用于"删除时已观察到的那次添加"，新的并发添加被保留。这个语义通常符合用户直觉（Add Wins 语义）。

总结：OR-Set 通过标签化每次添加，把模糊的"元素级删除"变成了精确的"特定操作的撤销"，从根本上消除了添加/删除的并发冲突，数学上可证明合并操作满足交换律和结合律。

假设你在设计一个全球多活的用户积分系统（用户消费 1 元 = 1 积分），要求写入不能阻塞（W=1），同时又不能出现积分多算或少算。请思考：这个需求能用最终一致性实现吗？如果能，怎么做？

参考答案
积分累加可以，但"不透支"约束不行------需要分别对待。

积分累加部分（能做到最终一致） ：
积分的"增加"和"减少"满足交换律和结合律，可以用 PN-Counter（CRDT） 实现：

每个节点维护两个 G-Counter：P（正向增加）和 N（负向减少）。
增加积分：本地 P[自己] += delta，W=1 立即返回。
减少积分：本地 N[自己] += delta，W=1 立即返回。
合并规则：对所有节点的 P 和 N 各取 max，最终积分 = sum(P) - sum(N)。
无论顺序如何合并，结果始终正确。

"不透支"约束（无法用最终一致性保证） ：
如果用户在两个机房并发兑换，两次兑换都通过了 W=1 的写入，但积分余额只够兑换一次，就会出现超支。这是最终一致性的固有限制------"余额不能为负"是一个跨节点的全局约束，天然需要强一致性来保证。

工程取舍 ：常见做法是"允许少量超支，事后补偿"（类似航空超售），或对高价值积分兑换走强一致路径（限流 + 多数派确认），低价值操作走最终一致路径。

总结：积分累计可以最终一致（PN-Counter），但积分余额约束（不透支）是强一致问题。在系统设计层面需要明确边界------不是所有问题都能让 CRDT 一招搞定。