分布式事务进阶

第一阶段:小白入门 ------ 为什么会有分布式事务?

  1. 以前的世界(单体应用)
    在单体应用时代(一个 Spring Boot 连接一个 MySQL),事务非常简单。

ACID:数据库(DB)帮你搞定了一切。

原子性(A):要么全成功,要么全失败。

原理:依赖数据库的 Connection,开启事务 -> 执行 SQL -> 提交/回滚。

结论:本地事务(Local Transaction) 是完美的。

  1. 现在的世界(微服务)

我们将系统拆分成了:订单服务(Order DB)、库存服务(Stock DB)、账户服务(Account DB)。

场景:用户下单。

订单库:创建订单。

库存库:扣减库存。

账户库:扣减余额。

问题:这三个库在不同的服务器上。

如果 1 和 2 成功了,3 失败了(余额没扣),怎么办?

此时,数据库的本地事务只能管自己,管不了别人。

结论:我们需要一种机制,能跨越网络,保证这三个操作要么一起成功,要么一起失败。这就是分布式事务。

第二阶段:进阶理解 ------ 两大流派(刚性 vs 柔性)

根据 CAP 定理(一致性、可用性、分区容错性不可兼得),分布式事务分为了两个流派:

  1. 刚性事务 (CP):死磕一致性
    口号:"为了数据绝对对,我宁愿把系统卡死。"
    代表:XA / 2PC。
    特点:
    强一致:用户看到的永远是对的。
    性能差:因为要等待所有节点确认,期间数据库资源被锁死(阻塞)。
    场景:银行核心系统、并发极低的后台管理。
  2. 柔性事务 (AP):追求高可用
    口号:"允许短暂的不一致,只要最终对就行。别卡住我的业务!"
    代表:TCC、Saga、事务消息、本地消息表。
    特点:
    最终一致:中间可能看到"扣了款但没发货"的状态,但过一会就好了。
    性能高:不锁数据库资源,业务跑得快。
    场景:互联网高并发业务(电商、支付、社交)。
    第三阶段:高手拆解 ------ 主流方案深度剖析
    这里是面试和架构设计的核心战场。

    第四阶段:架构师视角 ------ 深度思考与选型
  3. 为什么 3PC 是个"伪命题"?
    它试图用"超时自动提交"来解决 2PC 的阻塞。
    但在分布式网络中,超时不代表对方挂了,可能只是网络慢。
    后果:一旦"猜错",数据就乱了(脑裂)。在金融场景下,数据错比系统卡死更可怕。所以 3PC 被工业界抛弃。
  4. Saga 的"脏读"怎么解?
    Saga 是直接提交本地事务的,所以中间状态(如扣了库存但还没扣款)对别人是可见的。
    解法:必须在业务层面加**"语义锁"**。
    比如:库存扣减后,打个标 status = FREEZING。
    别的事务看到这个标,就绕道走,或者只读不改。
  5. TCC 的"空回滚"与"悬挂"
    空回滚:Try 没收到(丢包),Cancel 却到了。Cancel 必须能识别并返回成功。
    悬挂:Cancel 比 Try 先到(网络乱序)。Cancel 执行完后,Try 才到。Try 必须能识别并拒绝执行。
    结论:写 TCC 不仅仅是写业务逻辑,更多是在处理网络异常。
  6. 终极选型决策树 (Cheat Sheet)
    当你面临技术选型时,问自己三个问题:
    涉及到钱吗?(强一致性)
    是 -> TCC(最稳,但最贵)。
    是(但开发资源不足) -> Seata AT(Java 栈首选)。
    流程很长吗?(涉及第三方)
    是 -> Saga(因为你没法让第三方配合你做 TCC)。
    允许延迟吗?(非核心链路)
    是(如发短信、送积分) -> 事务消息 / 本地消息表(RocketMQ 是神器)。
    总结
    分布式事务没有"银弹",只有取舍(Trade-off)。
    ACID 是单机的童话。
    BASE(基本可用、软状态、最终一致性)是分布式的现实。
    从 2PC 到 TCC 再到 Saga,我们一直在用 "业务复杂度的上升" 来换取 "系统吞吐量的提升"。
相关推荐
zz07232019 小时前
Seata ——微服务分布式事务
分布式·微服务·架构·seata
小江的记录本20 小时前
【分布式】分布式系统核心知识体系:CAP定理、BASE理论与核心挑战
java·前端·网络·分布式·后端·python·安全
Roselind_Yi20 小时前
云计算实验实操|Hadoop伪分布式部署+MapReduce编程实践(超详细图文版)
大数据·hadoop·经验分享·笔记·分布式·数据挖掘·云计算
是垚不是土20 小时前
Kafka 故障排查周期长?试试 Kdoctor
linux·运维·分布式·ai·kafka·运维开发
小江的记录本21 小时前
【分布式】分布式一致性协议:2PC/3PC、Paxos、Raft、ZAB 核心原理、区别(2026必考Raft)
java·前端·分布式·后端·安全·面试·系统架构
小江的记录本1 天前
【分布式】分布式核心组件——分布式锁:Redis/ZooKeeper/etcd 实现方案(附全方位对比表)、优缺点、Redlock、时钟回拨问题
java·网络·redis·分布式·后端·zookeeper·架构
好家伙VCC1 天前
**发散创新:用Rust实现基于RAFT共识算法的轻量级分布式日志系统**在分布式系统中,**一致性协议**是保障数据可靠
java·分布式·python·rust·共识算法
小江的记录本1 天前
【分布式】分布式核心组件——分布式ID生成:雪花算法、号段模式、美团Leaf、百度UidGenerator、时钟回拨解决方案
分布式·后端·算法·缓存·性能优化·架构·系统架构
切糕师学AI1 天前
HBase:一文搞懂分布式宽列数据库(原理 + 架构 + 实战)
数据库·分布式·nosql·hbase·分布式宽列数据库·wide column db
未秃头的程序猿2 天前
从零到一:深入浅出分布式锁原理与Spring Boot实战(Redis + ZooKeeper)
spring boot·分布式·后端