MVCC(Multi-Version Concurrency Control,多版本并发控制)是 MySQL InnoDB 存储引擎实现事务隔离级别的核心机制,其核心目标是在不加锁(或减少加锁)的情况下,实现读写并发,同时保证事务的隔离性,避免脏读、不可重复读等问题,大幅提升数据库的并发性能。
一、MVCC 的核心思想
MVCC 为每行数据维护多个版本(快照),不同事务在访问同一行数据时,会根据自身的 "视图" 看到不同版本的数据:
- 读操作(SELECT):无需加锁,直接读取符合事务版本的快照,避免与写操作互斥;
- 写操作(INSERT/UPDATE/DELETE):不修改原数据,而是创建数据的新版本,旧版本保留(由 undo log 维护),供其他事务读取。
简单来说:写操作创建新版本,读操作读取历史版本,读写互不阻塞。
二、MVCC 的核心依赖组件
InnoDB 实现 MVCC 依赖以下关键数据结构和日志,缺一不可:
2.1 行记录的隐藏列
InnoDB 为每张表的每行数据默认添加 3 个隐藏列(用户不可见),用于版本管理:
| 隐藏列 | 作用 | 数据类型 |
|---|---|---|
| DB_TRX_ID | 最后一次修改该行数据的事务 ID(插入 / 更新),删除视为 "更新"(标记删除) | 6 字节 |
| DB_ROLL_PTR | 回滚指针,指向 undo log 中该记录的历史版本(形成版本链) | 7 字节 |
| DB_ROW_ID | 行 ID(聚簇索引的默认主键,仅当表无主键 / 唯一索引时生成) | 6 字节 |
2.2 Undo Log(回滚日志)
- 作用:
保存数据的历史版本(每次修改行数据时,先将旧版本写入 undo log);
事务回滚时,通过 undo log 恢复数据;
为 MVCC 提供历史版本数据。 - 版本链:每行数据的DB_ROLL_PTR指向 undo log 中该记录的上一个版本,所有版本通过回滚指针串联成版本链(头节点是最新版本)。
- 类型:
INSERT_UNDO:记录插入操作的 undo 日志(事务提交后可直接删除,因为插入的行仅当前事务可见);
UPDATE_UNDO:记录更新 / 删除操作的 undo 日志(需保留至所有依赖该版本的事务结束)。
2.3 Read View(读视图)
Read View 是事务在执行快照读(普通 SELECT)时生成的可见性判断规则,决定了当前事务能看到哪些版本的数据。
Read View 的核心属性
| 属性 | 含义 |
|---|---|
| m_ids | 当前活跃(未提交)的事务 ID 列表 |
| min_trx_id | m_ids中的最小事务 ID |
| max_trx_id | 系统下一个要分配的事务 ID(即当前最大事务 ID+1) |
| creator_trx_id | 创建该 Read View 的事务 ID |
可见性判断规则
对于版本链中的某行数据版本(记其事务 ID 为trx_id),判断是否对当前事务可见:
- 如果 trx_id < min_trx_id:该版本由已提交的事务创建,可见;
- 如果 trx_id >= max_trx_id:该版本由未来的事务创建,不可见;
- 如果 min_trx_id ≤ trx_id < max_trx_id:
- 若trx_id在m_ids中(事务未提交),不可见;
- 若trx_id不在m_ids中(事务已提交),可见;
- 特殊:如果trx_id = creator_trx_id(当前事务自己修改的数据),可见。
2.4 事务 ID(Trx ID)
- InnoDB 为每个事务分配唯一的递增事务 ID;
- 事务开始时不一定分配 ID,仅当执行写操作(INSERT/UPDATE/DELETE)时才分配;
- 只读事务(仅 SELECT)可能不分配 ID,进一步提升性能。
三、MVCC 的工作流程(以可重复读为例)
MySQL 默认隔离级别是REPEATABLE READ(可重复读),MVCC 在该级别下的核心行为是:事务在第一次快照读时生成 Read View,后续所有快照读复用该 Read View。
示例:两个事务并发操作同一行数据
假设初始数据:表user有一行数据id=1, name='Tom',其DB_TRX_ID=100(初始事务 ID)。
| 时间 | 事务 A(读) | 事务 B(写) |
|---|---|---|
| T1 | 开始事务 | 开始事务 |
| T2 | 1.执行SELECT * FROM user WHERE id=1;(第一次快照读)2.生成 Read View:m_ids=[200](事务 B 的 ID)、min_trx_id=200、max_trx_id=201、creator_trx_id=199 3.读取行版本trx_id=100 < 200,可见,结果:Tom | - |
| T3 | - | 1.执行UPDATE user SET name='Jerry' WHERE id=1; 2.分配事务 ID=200 3.旧版本(trx_id=100)写入 undo log 4.新版本数据:name='Jerry',DB_TRX_ID=200,DB_ROLL_PTR指向旧版本 |
| T4 | 1.再次执行SELECT * FROM user WHERE id=1; 2.复用 T2 的 Read View 3.新版本trx_id=200在m_ids中,不可见 4.沿着版本链找旧版本trx_id=100,可见 5.结果仍为Tom(可重复读) | - |
| T5 | - | 提交事务 B |
| T6 | 1.第三次执行SELECT * FROM user WHERE id=1; 2.仍复用 T2 的 Read View 3.事务 B 已提交,但m_ids仍为[200](Read View 不更新) 4.结果还是Tom | - |
| T7 | 提交事务 A | - |
| T8 | 新事务 C | 1.执行SELECT * FROM user WHERE id=1; 2.生成新 Read View:m_ids=[]、min_trx_id=201、max_trx_id=202 3.新版本trx_id=200 < 201,可见,结果:Jerry |
关键结论:
- 事务 A 在整个生命周期内,无论事务 B 是否提交,都只能看到第一次快照读时的版本(可重复读);
- 新事务 C 在事务 B 提交后,能看到最新版本;
- 全程无锁,读写互不阻塞。
四、MVCC 在不同隔离级别的表现
MVCC 的行为随隔离级别不同而变化,核心差异在于Read View 的生成时机:
| 隔离级别 | Read View 生成时机 | 核心行为 | 解决的问题 |
|---|---|---|---|
| READ UNCOMMITTED(读未提交) | 不生成 Read View,直接读取最新版本 | 能看到未提交事务的修改(脏读) | 无(几乎不用) |
| READ COMMITTED(读已提交) | 每次快照读都生成新的 Read View | 每次读都能看到已提交的最新版本(不可重复读) | 脏读 |
| REPEATABLE READ(可重复读) | 第一次快照读生成 Read View,后续复用 | 事务内多次读结果一致(可重复读) | 脏读、不可重复读 |
| SERIALIZABLE(串行化) | 不依赖 MVCC,直接加锁(间隙锁 / 行锁) | 读写互斥,完全串行 | 所有并发问题(性能差) |
五、MVCC 的两种读操作
InnoDB 中读操作分为两类,只有快照读依赖 MVCC:
- 快照读(Snapshot Read)
- 定义:读取数据的历史版本,不加锁,依赖 MVCC;
- 场景:普通 SELECT(无 FOR UPDATE/LOCK IN SHARE MODE);
- 特点:读写不阻塞,性能高。
- 当前读(Current Read)
- 定义:读取数据的最新版本,且会加锁(行锁 / 间隙锁),不依赖 MVCC;
- 场景:
SELECT ... FOR UPDATE(排他锁);
SELECT ... LOCK IN SHARE MODE(共享锁);
INSERT/UPDATE/DELETE(隐式当前读,先读最新版本再修改); - 特点:保证读取的是最新版本,会阻塞其他写操作,或被其他写操作阻塞。
六、MVCC 的优势与局限性
优势
- 读写并发:读不阻塞写,写不阻塞读(快照读),大幅提升高并发场景性能;
- 隔离性保证:通过版本链和 Read View,精准控制事务可见性,实现不同隔离级别;
- 无锁读:快照读无需加锁,避免锁竞争和死锁;
- 事务回滚高效:通过 undo log 快速回滚,无需重做整个操作。
局限性 - 版本链膨胀:大量更新操作会导致 undo log 版本链过长,快照读时需要遍历版本链,性能下降;
- undo log 清理:InnoDB 需要判断哪些 undo log 版本已无事务依赖,清理不及时会占用磁盘空间;
- 幻读问题(可重复读下):
MVCC 解决了 "不可重复读",但未完全解决 "幻读"(例如:事务 A 第一次读 10 行,事务 B 插入 1 行并提交,事务 A 用当前读(如SELECT ... FOR UPDATE)会读到 11 行); - InnoDB 通过间隙锁(Next-Key Lock) 补充解决幻读(仅可重复读级别)。
七、MVCC 与锁的关系
MVCC 并非完全替代锁,而是与锁配合工作:
- 快照读:依赖 MVCC,无锁;
- 当前读:依赖锁(行锁、间隙锁),保证数据一致性;
- 写操作之间仍需加锁(如行锁),避免写写冲突;
- 死锁问题仍可能发生(如两个事务互相持有对方需要的锁)。
八、总结
MVCC 是 InnoDB 实现高性能并发的核心,其本质是通过版本链保存数据历史,通过 Read View 判断版本可见性,让不同事务看到不同版本的数据:
- 核心组件:隐藏列、undo log、Read View、事务 ID;
- 核心价值:读写分离,提升并发性能,保证事务隔离性;
- 关键差异:不同隔离级别的 Read View 生成时机决定了隔离性表现;
- 适用场景:快照读(普通 SELECT),当前读仍需锁配合。
理解 MVCC 是掌握 InnoDB 事务、隔离级别、锁机制的关键,也是优化 MySQL 高并发性能的基础。