XA分布式事务 - 技术栈

在分布式数据库（如你正在研究的 TDSQL ）中，XA 分布式事务 是保证跨多个节点操作时数据"要么全成功，要么全回滚"的标准方案。它是一种基于强一致性的设计，在金融级场景中应用广泛。

XA 是由 X/Open 组织提出的分布式事务处理标准。它定义了三个核心组件之间的交互：

在分布式数据库（如 TDSQL）中，2PC 旨在将跨多个分片（Set）的操作封装为一个原子事务。该过程由 事务管理器（TM，如 SQL 引擎） 统一调度，各 资源管理器（RM，如 MySQL+Agent） 协同配合。

此阶段的目标是"探测"所有参与者是否具备提交事务的能力，并锁定必要资源。

下发预提议 ：TM 向所有参与该事务的 RM 发送 XA PREPARE 指令。
资源锁定与日志落盘 ：
- RM 在本地执行 SQL 操作。
- RM 记录 Redo Log （用于故障恢复）和 Undo Log（用于回滚）。
- RM 锁定相关的数据库行记录，防止其他事务修改。
反馈承诺 ：
- 若执行成功，RM 返回 Ready 状态，并承诺只要 TM 要求提交，它一定能成功。
- 若因锁冲突或空间不足失败，RM 返回 Fail。

此阶段根据第一阶段的投票结果，执行"全成"或"全败"的最终决策。

决策逻辑 ：
- 全局提交 ：只有当所有 RM 都反馈 Ready 时，TM 才在日志中标记事务为"已决定提交"，并广播 XA COMMIT。
- 全局回滚 ：只要有任意一个 RM 反馈 Fail 或超时未响应，TM 广播 XA ROLLBACK。
执行与释放 ：
- RM 接收到 COMMIT 指令后，正式修改数据状态并释放持有的物理锁。
确认回执 (ACK) ：
- RM 在完成本地提交后，必须向 TM 发送 ACK 确认信号。
事务终结 ：
- TM 收集到所有 RM 的 ACK 后，认为该分布式事务生命周期彻底结束，从内存中抹除事务状态，并向客户端返回成功。

根据不同的阶段和丢包发生的时刻，处理机制有所不同。我们可以分情况来看：

场景：SQL 引擎（协调器）发送了 PREPARE，某个 Set 执行成功并返回了 Ready，但这个响应包在网络中丢了。

场景：所有 Set 都返回了 Ready。SQL 引擎发出了 COMMIT 指令，但发往其中一个 Set 的指令包丢了。

结果：其他 Set 成功提交了，但那个丢包的 Set 还傻傻地带着锁在等指令。
处理：
- 重试机制（推模式） ：SQL 引擎（作为协调器）会记录事务日志。如果发现某个 Set 没有确认 Commit 成功，它会不断地重试发送 COMMIT 指令，直到该 Set 成功接收并返回确认为止。
- Agent 的作用（拉模式） ：在 TDSQL 架构中，分布在各机器上的 Agent 会发现本地有一个"处于 Prepare 状态但超时的事务"，它会去询问 ZooKeeper 或管理节点："这个事务到底该不该提？" 一旦得到确认为 Commit，Agent 会在本地强制 MySQL 完成提交。

如果 SQL 引擎在刚发出第一个 COMMIT 包后就挂了，且接收到包的 Set 也挂了。

问题：剩下的 Set 处于 Ready 状态，它们不敢私自提交（万一有人失败了呢），也不敢私自回滚（万一协调器已经让别人提交了呢）。这就造成了资源阻塞。
TDSQL 的解决办法 ：
- 利用 ZooKeeper ：TDSQL 将全局事务的状态记录在强一致性的 ZooKeeper 中。
- 故障自愈：当新的 SQL 引擎（新协调器）通过选举产生后，它会去 ZooKeeper 读取未完成的事务状态。如果发现事务标记为"已决定提交"，它会通知所有 Set 继续执行。

之所以"推"和"拉"都要，本质上是为了在性能、实时性 和极端容灾之间取得平衡。

核心问题：无法处理"协调者单点崩溃"。

核心问题：实时性差，且对核心组件压力巨大。

效率低下 ：Agent 扫描本地事务并询问 ZooKeeper 通常是定时触发的（比如每 5 秒或 10 秒一次）。如果只靠"拉"，每次网络抖动导致的丢包都要等几秒钟才能恢复，这会显著拉低系统的吞吐量。
"惊群效应"与性能损耗 ：
- 如果一个事务涉及 100 个 Set，丢包后这 100 个 Agent 都去疯狂询问 ZooKeeper，会给 ZK 带来巨大的瞬间压力。
- 频繁轮询本地事务表也会消耗数据库服务器的 CPU 和 IO。
结论：只靠"拉"，系统会变得非常"迟钝"，且在高并发场景下容易产生不必要的性能瓶颈。

优点	缺点
强一致性：最接近单机数据库的体验，不会出现中间状态。	性能损耗高：两次网络往返（RTT），且在整个过程中会长时间占用数据库锁。
业务透明：由底层架构处理，开发者不需要写复杂的补偿逻辑。	同步阻塞：如果 TM 在第二阶段前宕机，参与者会陷入等待，资源无法释放。
行业标准：主流数据库（MySQL, PostgreSQL, Oracle）原生支持。	单点故障：对协调器（TM）的依赖性极强。