MySQL 的 MVCC(多版本并发控制)详解

MVCC(Multi-Version Concurrency Control,多版本并发控制)是 MySQL InnoDB 存储引擎实现事务隔离级别的核心机制,其核心目标是在不加锁(或减少加锁)的情况下,实现读写并发,同时保证事务的隔离性,避免脏读、不可重复读等问题,大幅提升数据库的并发性能。

一、MVCC 的核心思想

MVCC 为每行数据维护多个版本(快照),不同事务在访问同一行数据时,会根据自身的 "视图" 看到不同版本的数据:

  • 读操作(SELECT):无需加锁,直接读取符合事务版本的快照,避免与写操作互斥;
  • 写操作(INSERT/UPDATE/DELETE):不修改原数据,而是创建数据的新版本,旧版本保留(由 undo log 维护),供其他事务读取。

简单来说:写操作创建新版本,读操作读取历史版本,读写互不阻塞。

二、MVCC 的核心依赖组件

InnoDB 实现 MVCC 依赖以下关键数据结构和日志,缺一不可:

2.1 行记录的隐藏列

InnoDB 为每张表的每行数据默认添加 3 个隐藏列(用户不可见),用于版本管理:

隐藏列 作用 数据类型
DB_TRX_ID 最后一次修改该行数据的事务 ID(插入 / 更新),删除视为 "更新"(标记删除) 6 字节
DB_ROLL_PTR 回滚指针,指向 undo log 中该记录的历史版本(形成版本链) 7 字节
DB_ROW_ID 行 ID(聚簇索引的默认主键,仅当表无主键 / 唯一索引时生成) 6 字节
2.2 Undo Log(回滚日志)
  • 作用:
    保存数据的历史版本(每次修改行数据时,先将旧版本写入 undo log);
    事务回滚时,通过 undo log 恢复数据;
    为 MVCC 提供历史版本数据。
  • 版本链:每行数据的DB_ROLL_PTR指向 undo log 中该记录的上一个版本,所有版本通过回滚指针串联成版本链(头节点是最新版本)。
  • 类型:
    INSERT_UNDO:记录插入操作的 undo 日志(事务提交后可直接删除,因为插入的行仅当前事务可见);
    UPDATE_UNDO:记录更新 / 删除操作的 undo 日志(需保留至所有依赖该版本的事务结束)。
2.3 Read View(读视图)

Read View 是事务在执行快照读(普通 SELECT)时生成的可见性判断规则,决定了当前事务能看到哪些版本的数据。

Read View 的核心属性

属性 含义
m_ids 当前活跃(未提交)的事务 ID 列表
min_trx_id m_ids中的最小事务 ID
max_trx_id 系统下一个要分配的事务 ID(即当前最大事务 ID+1)
creator_trx_id 创建该 Read View 的事务 ID

可见性判断规则

对于版本链中的某行数据版本(记其事务 ID 为trx_id),判断是否对当前事务可见:

  1. 如果 trx_id < min_trx_id:该版本由已提交的事务创建,可见;
  2. 如果 trx_id >= max_trx_id:该版本由未来的事务创建,不可见;
  3. 如果 min_trx_id ≤ trx_id < max_trx_id:
  • 若trx_id在m_ids中(事务未提交),不可见;
  • 若trx_id不在m_ids中(事务已提交),可见;
  1. 特殊:如果trx_id = creator_trx_id(当前事务自己修改的数据),可见。
2.4 事务 ID(Trx ID)
  • InnoDB 为每个事务分配唯一的递增事务 ID;
  • 事务开始时不一定分配 ID,仅当执行写操作(INSERT/UPDATE/DELETE)时才分配;
  • 只读事务(仅 SELECT)可能不分配 ID,进一步提升性能。

三、MVCC 的工作流程(以可重复读为例)

MySQL 默认隔离级别是REPEATABLE READ(可重复读),MVCC 在该级别下的核心行为是:事务在第一次快照读时生成 Read View,后续所有快照读复用该 Read View。

示例:两个事务并发操作同一行数据

假设初始数据:表user有一行数据id=1, name='Tom',其DB_TRX_ID=100(初始事务 ID)。

时间 事务 A(读) 事务 B(写)
T1 开始事务 开始事务
T2 1.执行SELECT * FROM user WHERE id=1;(第一次快照读)2.生成 Read View:m_ids=[200](事务 B 的 ID)、min_trx_id=200、max_trx_id=201、creator_trx_id=199 3.读取行版本trx_id=100 < 200,可见,结果:Tom -
T3 - 1.执行UPDATE user SET name='Jerry' WHERE id=1; 2.分配事务 ID=200 3.旧版本(trx_id=100)写入 undo log 4.新版本数据:name='Jerry',DB_TRX_ID=200,DB_ROLL_PTR指向旧版本
T4 1.再次执行SELECT * FROM user WHERE id=1; 2.复用 T2 的 Read View 3.新版本trx_id=200在m_ids中,不可见 4.沿着版本链找旧版本trx_id=100,可见 5.结果仍为Tom(可重复读) -
T5 - 提交事务 B
T6 1.第三次执行SELECT * FROM user WHERE id=1; 2.仍复用 T2 的 Read View 3.事务 B 已提交,但m_ids仍为[200](Read View 不更新) 4.结果还是Tom -
T7 提交事务 A -
T8 新事务 C 1.执行SELECT * FROM user WHERE id=1; 2.生成新 Read View:m_ids=[]、min_trx_id=201、max_trx_id=202 3.新版本trx_id=200 < 201,可见,结果:Jerry

关键结论:

  • 事务 A 在整个生命周期内,无论事务 B 是否提交,都只能看到第一次快照读时的版本(可重复读);
  • 新事务 C 在事务 B 提交后,能看到最新版本;
  • 全程无锁,读写互不阻塞。

四、MVCC 在不同隔离级别的表现

MVCC 的行为随隔离级别不同而变化,核心差异在于Read View 的生成时机:

隔离级别 Read View 生成时机 核心行为 解决的问题
READ UNCOMMITTED(读未提交) 不生成 Read View,直接读取最新版本 能看到未提交事务的修改(脏读) 无(几乎不用)
READ COMMITTED(读已提交) 每次快照读都生成新的 Read View 每次读都能看到已提交的最新版本(不可重复读) 脏读
REPEATABLE READ(可重复读) 第一次快照读生成 Read View,后续复用 事务内多次读结果一致(可重复读) 脏读、不可重复读
SERIALIZABLE(串行化) 不依赖 MVCC,直接加锁(间隙锁 / 行锁) 读写互斥,完全串行 所有并发问题(性能差)

五、MVCC 的两种读操作

InnoDB 中读操作分为两类,只有快照读依赖 MVCC:

  1. 快照读(Snapshot Read)
  • 定义:读取数据的历史版本,不加锁,依赖 MVCC;
  • 场景:普通 SELECT(无 FOR UPDATE/LOCK IN SHARE MODE);
  • 特点:读写不阻塞,性能高。
  1. 当前读(Current Read)
  • 定义:读取数据的最新版本,且会加锁(行锁 / 间隙锁),不依赖 MVCC;
  • 场景:
    SELECT ... FOR UPDATE(排他锁);
    SELECT ... LOCK IN SHARE MODE(共享锁);
    INSERT/UPDATE/DELETE(隐式当前读,先读最新版本再修改);
  • 特点:保证读取的是最新版本,会阻塞其他写操作,或被其他写操作阻塞。

六、MVCC 的优势与局限性

优势

  • 读写并发:读不阻塞写,写不阻塞读(快照读),大幅提升高并发场景性能;
  • 隔离性保证:通过版本链和 Read View,精准控制事务可见性,实现不同隔离级别;
  • 无锁读:快照读无需加锁,避免锁竞争和死锁;
  • 事务回滚高效:通过 undo log 快速回滚,无需重做整个操作。
    局限性
  • 版本链膨胀:大量更新操作会导致 undo log 版本链过长,快照读时需要遍历版本链,性能下降;
  • undo log 清理:InnoDB 需要判断哪些 undo log 版本已无事务依赖,清理不及时会占用磁盘空间;
  • 幻读问题(可重复读下):
    MVCC 解决了 "不可重复读",但未完全解决 "幻读"(例如:事务 A 第一次读 10 行,事务 B 插入 1 行并提交,事务 A 用当前读(如SELECT ... FOR UPDATE)会读到 11 行);
  • InnoDB 通过间隙锁(Next-Key Lock) 补充解决幻读(仅可重复读级别)。

七、MVCC 与锁的关系

MVCC 并非完全替代锁,而是与锁配合工作:

  • 快照读:依赖 MVCC,无锁;
  • 当前读:依赖锁(行锁、间隙锁),保证数据一致性;
  • 写操作之间仍需加锁(如行锁),避免写写冲突;
  • 死锁问题仍可能发生(如两个事务互相持有对方需要的锁)。

八、总结

MVCC 是 InnoDB 实现高性能并发的核心,其本质是通过版本链保存数据历史,通过 Read View 判断版本可见性,让不同事务看到不同版本的数据:

  • 核心组件:隐藏列、undo log、Read View、事务 ID;
  • 核心价值:读写分离,提升并发性能,保证事务隔离性;
  • 关键差异:不同隔离级别的 Read View 生成时机决定了隔离性表现;
  • 适用场景:快照读(普通 SELECT),当前读仍需锁配合。

理解 MVCC 是掌握 InnoDB 事务、隔离级别、锁机制的关键,也是优化 MySQL 高并发性能的基础。

相关推荐
Shingmc34 小时前
MySQL表的增删改查
数据库·mysql
敲上瘾4 小时前
MySQL主从集群解析:从原理到Docker实战部署
android·数据库·分布式·mysql·docker·数据库架构
电子_咸鱼4 小时前
【QT——信号和槽(1)】
linux·c语言·开发语言·数据库·c++·git·qt
pandarking4 小时前
[CTF]攻防世界:web-unfinish(sql二次注入)
前端·数据库·sql·web安全·ctf
程序猿20234 小时前
MySQL索引性能分析
数据库·mysql
TDengine (老段)4 小时前
TDengine 新性能基准测试工具 taosgen
大数据·数据库·物联网·测试工具·时序数据库·tdengine·涛思数据
波波仔864 小时前
行存储与列存储的区别
数据库·clickhouse·行存储·列储存
小光学长4 小时前
ssm农民养殖经验交流与分享平台bc046578(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
java·数据库·spring
在坚持一下我可没意见4 小时前
Spring 开发小白学习过程中常用通用配置文件,即拿即用!(持续更新中)
java·数据库·后端·学习·spring·tomcat·mybatis