Undo Log(回滚日志)在 MySQL 中的核心作用远不止于生成 ReadView。它在事务的原子性(Atomicity)、一致性(Consistency)以及实现 MVCC 的多版本数据访问中都扮演着至关重要的角色。 生成 ReadView 并利用 Undo Log 构建版本链只是它功能的一部分。
以下是 Undo Log 的主要作用和它与 ReadView 的关系:
Undo Log 的核心作用
-
实现事务的原子性 (Atomicity) - 回滚 (Rollback):
- 这是 Undo Log 最根本、最核心的作用。
- 当一个事务需要回滚 (用户显式执行
ROLLBACK
或系统检测到错误自动回滚)时,InnoDB 会利用 Undo Log 中记录的旧版本数据,将数据行精确地恢复到该事务开始之前的状态。 - Undo Log 中存储了逻辑逆操作 :
- 对于
INSERT
:Undo Log 记录该新行的主键信息,回滚时执行DELETE
。 - 对于
DELETE
:Undo Log 记录被删除行的完整内容(包括所有字段值),回滚时执行INSERT
。 - 对于
UPDATE
:Undo Log 记录被修改字段的旧值,回滚时将这些字段值恢复。
- 对于
- 没有 Undo Log,事务的回滚就无法实现,原子性就无从谈起。
-
支持多版本并发控制 (MVCC) - 构建行版本链:
- 这是你问题中提到的部分,也是实现 可重复读 (RR) 和 读已提交 (RC) 隔离级别的关键。
- 当一行数据被修改时,其旧版本的数据(或者说修改前的状态)会被写入 Undo Log。
- 该行的隐藏字段
DB_ROLL_PTR
会指向这个 Undo Log 记录。如果这行数据被多次修改,就会形成一个通过DB_ROLL_PTR
指针串联起来的历史版本链。 - 当生成 ReadView 后:
- 事务执行快照读 (
SELECT
) 时,会根据 ReadView 的可见性规则(trx_id
与活跃事务列表m_ids
、min_trx_id
、max_trx_id
的比较)沿着这个版本链回溯。 - 找到符合规则(对该 ReadView 可见)的最"新"的历史版本(不一定是物理上最新的,而是逻辑上对该事务可见的)。
- 事务执行快照读 (
- 因此,Undo Log 为 MVCC 提供了访问历史版本数据的物理存储基础。没有 Undo Log 存储旧版本数据,ReadView 就无法找到它需要看到的那个"快照"版本。
ReadView 与 Undo Log 的关系总结
- ReadView 是"规则": 它定义了在某个特定时间点(通常是事务第一次
SELECT
时),哪些数据版本对当前事务是可见的(基于事务ID的活跃性判断)。它本身不存储数据。 - Undo Log 是"仓库": 它存储了数据行的历史版本(旧值)。当需要根据 ReadView 的规则查找某个特定版本的数据时,数据库引擎就通过
DB_ROLL_PTR
指针深入到 Undo Log 这个"仓库"中去寻找符合条件的具体数据内容。 - 协同工作实现 MVCC: ReadView 告诉引擎"我需要看到哪个时间点的数据",Undo Log 提供"那个时间点的数据具体长什么样"。两者结合,使得不同事务可以无锁地看到数据库在不同时间点的"快照"。
Undo Log 的生命周期与清理
- 写入: 发生在数据被修改(
INSERT
/UPDATE
/DELETE
)时。 - 使用:
- 事务回滚时使用。
- MVCC 快照读访问历史版本时使用。
- 清理 (Purge):
- 当一个旧版本数据(存储在 Undo Log 中)不再被任何活跃事务的 ReadView 所需要时,它就变成了可以被清理的"垃圾"。
- InnoDB 有一个后台的 Purge 线程专门负责扫描和清理这些不再需要的 Undo Log 记录。
- 清理至关重要: 如果不及时清理,Undo Log 会无限增长,占用大量磁盘空间。这也是为什么长事务(长时间不提交或回滚的事务)非常危险的原因之一------它会阻止 Purge 线程清理它启动之前产生的旧 Undo Log 版本,导致 Undo Log 文件(通常位于
ibdata1
或独立的 undo tablespace 中)不断膨胀。
结论
Undo Log 绝不仅仅是为了生成 ReadView 而存在的。 它的首要和核心职责是实现事务的原子性,保证事务可以安全回滚 。在此基础之上,它才被巧妙地复用来存储历史数据版本,为 MVCC 提供支持,从而实现非锁定读(快照读)和可重复读等隔离级别特性。
可以说:
- 回滚 (Rollback) 是 Undo Log 存在的根本原因。
- 支持 MVCC 是 Undo Log 能力的重要扩展应用。
两者相辅相成,共同构成了 InnoDB 实现 ACID 特性(特别是 A 和 I)以及高性能并发控制的关键基石。