浅谈mysql的undolog

Undo Log(回滚日志)在 MySQL 中的核心作用远不止于生成 ReadView。它在事务的原子性(Atomicity)、一致性(Consistency)以及实现 MVCC 的多版本数据访问中都扮演着至关重要的角色。 生成 ReadView 并利用 Undo Log 构建版本链只是它功能的一部分。

以下是 Undo Log 的主要作用和它与 ReadView 的关系:

Undo Log 的核心作用

  1. 实现事务的原子性 (Atomicity) - 回滚 (Rollback):

    • 这是 Undo Log 最根本、最核心的作用
    • 当一个事务需要回滚 (用户显式执行 ROLLBACK 或系统检测到错误自动回滚)时,InnoDB 会利用 Undo Log 中记录的旧版本数据,将数据行精确地恢复到该事务开始之前的状态。
    • Undo Log 中存储了逻辑逆操作
      • 对于 INSERT:Undo Log 记录该新行的主键信息,回滚时执行 DELETE
      • 对于 DELETE:Undo Log 记录被删除行的完整内容(包括所有字段值),回滚时执行 INSERT
      • 对于 UPDATE:Undo Log 记录被修改字段的旧值,回滚时将这些字段值恢复。
    • 没有 Undo Log,事务的回滚就无法实现,原子性就无从谈起。
  2. 支持多版本并发控制 (MVCC) - 构建行版本链:

    • 这是你问题中提到的部分,也是实现 可重复读 (RR)读已提交 (RC) 隔离级别的关键。
    • 当一行数据被修改时,其旧版本的数据(或者说修改前的状态)会被写入 Undo Log。
    • 该行的隐藏字段 DB_ROLL_PTR 会指向这个 Undo Log 记录。如果这行数据被多次修改,就会形成一个通过 DB_ROLL_PTR 指针串联起来的历史版本链
    • 当生成 ReadView 后:
      • 事务执行快照读 (SELECT) 时,会根据 ReadView 的可见性规则(trx_id 与活跃事务列表 m_idsmin_trx_idmax_trx_id 的比较)沿着这个版本链回溯。
      • 找到符合规则(对该 ReadView 可见)的最"新"的历史版本(不一定是物理上最新的,而是逻辑上对该事务可见的)。
    • 因此,Undo Log 为 MVCC 提供了访问历史版本数据的物理存储基础。没有 Undo Log 存储旧版本数据,ReadView 就无法找到它需要看到的那个"快照"版本。

ReadView 与 Undo Log 的关系总结

  1. ReadView 是"规则": 它定义了在某个特定时间点(通常是事务第一次 SELECT 时),哪些数据版本对当前事务是可见的(基于事务ID的活跃性判断)。它本身不存储数据。
  2. Undo Log 是"仓库": 它存储了数据行的历史版本(旧值)。当需要根据 ReadView 的规则查找某个特定版本的数据时,数据库引擎就通过 DB_ROLL_PTR 指针深入到 Undo Log 这个"仓库"中去寻找符合条件的具体数据内容。
  3. 协同工作实现 MVCC: ReadView 告诉引擎"我需要看到哪个时间点的数据",Undo Log 提供"那个时间点的数据具体长什么样"。两者结合,使得不同事务可以无锁地看到数据库在不同时间点的"快照"。

Undo Log 的生命周期与清理

  • 写入: 发生在数据被修改(INSERT/UPDATE/DELETE)时。
  • 使用:
    • 事务回滚时使用。
    • MVCC 快照读访问历史版本时使用。
  • 清理 (Purge):
    • 当一个旧版本数据(存储在 Undo Log 中)不再被任何活跃事务的 ReadView 所需要时,它就变成了可以被清理的"垃圾"。
    • InnoDB 有一个后台的 Purge 线程专门负责扫描和清理这些不再需要的 Undo Log 记录。
    • 清理至关重要: 如果不及时清理,Undo Log 会无限增长,占用大量磁盘空间。这也是为什么长事务(长时间不提交或回滚的事务)非常危险的原因之一------它会阻止 Purge 线程清理它启动之前产生的旧 Undo Log 版本,导致 Undo Log 文件(通常位于 ibdata1 或独立的 undo tablespace 中)不断膨胀。

结论

Undo Log 绝不仅仅是为了生成 ReadView 而存在的。 它的首要和核心职责是实现事务的原子性,保证事务可以安全回滚 。在此基础之上,它才被巧妙地复用来存储历史数据版本,为 MVCC 提供支持,从而实现非锁定读(快照读)和可重复读等隔离级别特性。

可以说:

  • 回滚 (Rollback) 是 Undo Log 存在的根本原因。
  • 支持 MVCC 是 Undo Log 能力的重要扩展应用。

两者相辅相成,共同构成了 InnoDB 实现 ACID 特性(特别是 A 和 I)以及高性能并发控制的关键基石。

相关推荐
廿一夏4 小时前
MySql存储引擎与索引
数据库·sql·mysql
lzhdim6 小时前
SQL 入门 15:SQL 事务:从 ACID 到四种常见的并发问题
数据库·sql
瀚高PG实验室6 小时前
瀚高企业版V9.1.1在pg_restore还原备份文件时提示extract函数语法问题
数据库·瀚高数据库
TDengine (老段)6 小时前
TDengine Tag 设计哲学与 Schema 变更机制
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
敲个大西瓜7 小时前
Java项目常用数据归档方式
mysql
YOU OU7 小时前
Spring IoC&DI
java·数据库·spring
Muscleheng8 小时前
Navicat连接postgresql时出现‘datlastsysoid does not exist‘报错
数据库·postgresql
kyriewen9 小时前
面试官让我查各部门工资最高的员工,我用AI三秒写出窗口函数,他愣了
后端·mysql·面试
小码工作室9 小时前
使用 HAVING 进行 MySQL 集合筛选
mysql
罗超驿9 小时前
18.事务的隔离性和隔离级别:MySQL面试高频考点全解析
数据库·mysql·面试