浅谈mysql的undolog

Undo Log(回滚日志)在 MySQL 中的核心作用远不止于生成 ReadView。它在事务的原子性(Atomicity)、一致性(Consistency)以及实现 MVCC 的多版本数据访问中都扮演着至关重要的角色。 生成 ReadView 并利用 Undo Log 构建版本链只是它功能的一部分。

以下是 Undo Log 的主要作用和它与 ReadView 的关系:

Undo Log 的核心作用

  1. 实现事务的原子性 (Atomicity) - 回滚 (Rollback):

    • 这是 Undo Log 最根本、最核心的作用
    • 当一个事务需要回滚 (用户显式执行 ROLLBACK 或系统检测到错误自动回滚)时,InnoDB 会利用 Undo Log 中记录的旧版本数据,将数据行精确地恢复到该事务开始之前的状态。
    • Undo Log 中存储了逻辑逆操作
      • 对于 INSERT:Undo Log 记录该新行的主键信息,回滚时执行 DELETE
      • 对于 DELETE:Undo Log 记录被删除行的完整内容(包括所有字段值),回滚时执行 INSERT
      • 对于 UPDATE:Undo Log 记录被修改字段的旧值,回滚时将这些字段值恢复。
    • 没有 Undo Log,事务的回滚就无法实现,原子性就无从谈起。
  2. 支持多版本并发控制 (MVCC) - 构建行版本链:

    • 这是你问题中提到的部分,也是实现 可重复读 (RR)读已提交 (RC) 隔离级别的关键。
    • 当一行数据被修改时,其旧版本的数据(或者说修改前的状态)会被写入 Undo Log。
    • 该行的隐藏字段 DB_ROLL_PTR 会指向这个 Undo Log 记录。如果这行数据被多次修改,就会形成一个通过 DB_ROLL_PTR 指针串联起来的历史版本链
    • 当生成 ReadView 后:
      • 事务执行快照读 (SELECT) 时,会根据 ReadView 的可见性规则(trx_id 与活跃事务列表 m_idsmin_trx_idmax_trx_id 的比较)沿着这个版本链回溯。
      • 找到符合规则(对该 ReadView 可见)的最"新"的历史版本(不一定是物理上最新的,而是逻辑上对该事务可见的)。
    • 因此,Undo Log 为 MVCC 提供了访问历史版本数据的物理存储基础。没有 Undo Log 存储旧版本数据,ReadView 就无法找到它需要看到的那个"快照"版本。

ReadView 与 Undo Log 的关系总结

  1. ReadView 是"规则": 它定义了在某个特定时间点(通常是事务第一次 SELECT 时),哪些数据版本对当前事务是可见的(基于事务ID的活跃性判断)。它本身不存储数据。
  2. Undo Log 是"仓库": 它存储了数据行的历史版本(旧值)。当需要根据 ReadView 的规则查找某个特定版本的数据时,数据库引擎就通过 DB_ROLL_PTR 指针深入到 Undo Log 这个"仓库"中去寻找符合条件的具体数据内容。
  3. 协同工作实现 MVCC: ReadView 告诉引擎"我需要看到哪个时间点的数据",Undo Log 提供"那个时间点的数据具体长什么样"。两者结合,使得不同事务可以无锁地看到数据库在不同时间点的"快照"。

Undo Log 的生命周期与清理

  • 写入: 发生在数据被修改(INSERT/UPDATE/DELETE)时。
  • 使用:
    • 事务回滚时使用。
    • MVCC 快照读访问历史版本时使用。
  • 清理 (Purge):
    • 当一个旧版本数据(存储在 Undo Log 中)不再被任何活跃事务的 ReadView 所需要时,它就变成了可以被清理的"垃圾"。
    • InnoDB 有一个后台的 Purge 线程专门负责扫描和清理这些不再需要的 Undo Log 记录。
    • 清理至关重要: 如果不及时清理,Undo Log 会无限增长,占用大量磁盘空间。这也是为什么长事务(长时间不提交或回滚的事务)非常危险的原因之一------它会阻止 Purge 线程清理它启动之前产生的旧 Undo Log 版本,导致 Undo Log 文件(通常位于 ibdata1 或独立的 undo tablespace 中)不断膨胀。

结论

Undo Log 绝不仅仅是为了生成 ReadView 而存在的。 它的首要和核心职责是实现事务的原子性,保证事务可以安全回滚 。在此基础之上,它才被巧妙地复用来存储历史数据版本,为 MVCC 提供支持,从而实现非锁定读(快照读)和可重复读等隔离级别特性。

可以说:

  • 回滚 (Rollback) 是 Undo Log 存在的根本原因。
  • 支持 MVCC 是 Undo Log 能力的重要扩展应用。

两者相辅相成,共同构成了 InnoDB 实现 ACID 特性(特别是 A 和 I)以及高性能并发控制的关键基石。

相关推荐
马克Markorg6 小时前
常见的向量数据库和具有向量数据库能力的数据库
数据库
Coder_Boy_8 小时前
技术让开发更轻松的底层矛盾
java·大数据·数据库·人工智能·深度学习
helloworldandy8 小时前
使用Pandas进行数据分析:从数据清洗到可视化
jvm·数据库·python
数据知道10 小时前
PostgreSQL 故障排查:如何找出数据库中最耗时的 SQL 语句
数据库·sql·postgresql
qq_124987075310 小时前
基于SSM的动物保护系统的设计与实现(源码+论文+部署+安装)
java·数据库·spring boot·毕业设计·ssm·计算机毕业设计
枷锁—sha10 小时前
【SRC】SQL注入WAF 绕过应对策略(二)
网络·数据库·python·sql·安全·网络安全
Coder_Boy_10 小时前
基于SpringAI的在线考试系统-考试系统开发流程案例
java·数据库·人工智能·spring boot·后端
Gain_chance10 小时前
35-学习笔记尚硅谷数仓搭建-DWS层最近n日汇总表及历史至今汇总表建表语句
数据库·数据仓库·hive·笔记·学习
此生只爱蛋11 小时前
【Redis】主从复制
数据库·redis
马猴烧酒.11 小时前
【面试八股|JAVA多线程】JAVA多线程常考面试题详解
java·服务器·数据库