数据库事务的 ACID,通过MVCC能做什么

数据库事务的 ACID 特性

原子性 (Atomicity):事务内的操作要么全部成功,要么全部回滚。

一致性 (Consistency):事务执行后数据库保持逻辑完整性(约束、业务规则)。

隔离性 (Isolation):事务并发执行时互不干扰。

持久性 (Durability):事务提交后修改永久有效。

事务并发问题

在并发场景下,若隔离性不足,可能引发以下问题:

脏读 (Dirty Read):事务 A 读取了事务 B 未提交的修改。

不可重复读 (Non-Repeatable Read):事务 A 多次读取同一数据,结果不一致(因事务 B 修改了该数据并提交)。

幻读 (Phantom Read):事务 A 多次查询同一条件,结果集的行数变化(因事务 B 插入或删除了符合条件的数据并提交)。

MVCC 如何解决这些问题?

MVCC(Multi-Version Concurrency Control,多版本并发控制) 是一种通过维护数据的多个版本来实现无锁并发控制的机制。它通过以下方式解决脏读、不可重复读和幻读:

1. MVCC 的核心原理

数据版本快照:每个事务启动时,会生成一个一致性视图(Read View),记录当前活跃事务的 ID 列表。

版本链:每条数据行保存多个版本,通过 DB_TRX_ID(事务 ID)和 DB_ROLL_PTR(回滚指针)链接到历史版本。

可见性规则:事务只能看到在它启动前已提交的版本,或由自身修改的版本。

2. 解决脏读

问题场景:

事务 B 修改数据但未提交,事务 A 读取了该未提交的脏数据。

MVCC 的解决方案:

事务 A 读取数据时,根据其 Read View 判断数据版本的可见性。

若数据版本对应的事务(事务 B)未提交,则沿着版本链找到已提交的最新版本。

结果:事务 A 读取的是事务 B 修改前的已提交版本,避免脏读。

3. 解决不可重复读

问题场景:

事务 A 第一次读取数据后,事务 B 修改并提交了该数据,事务 A 再次读取时结果不一致。

MVCC 的解决方案:

在 可重复读(Repeatable Read) 隔离级别下,事务 A 的 Read View 在第一次查询时生成,后续所有读取都基于此视图。

即使事务 B 提交了新版本,事务 A 仍通过版本链读取旧版本数据。

结果:事务 A 多次读取同一数据的结果一致,避免不可重复读。

4. 解决幻读

问题场景:

事务 A 根据条件查询得到结果集,事务 B 插入或删除符合条件的数据并提交,事务 A 再次查询时结果集行数变化。

MVCC 的解决方案:

可重复读(RR)隔离级别下:

快照读(普通 SELECT):事务 A 基于一致性视图读取数据,其他事务插入的新数据对其不可见,避免幻读。

当前读(SELECT FOR UPDATE 或 UPDATE/DELETE):通过 间隙锁(Gap Lock) 锁定范围,阻止其他事务插入符合条件的数据。

读已提交(RC)隔离级别下:

MVCC 仅解决部分幻读问题,但可能因其他事务插入新数据导致幻读。

MVCC 的具体实现(以 MySQL InnoDB 为例)

1. 隐藏字段

每条记录包含以下隐藏字段:

DB_TRX_ID:最后修改该数据的事务 ID。

DB_ROLL_PTR:指向 Undo Log 中旧版本数据的指针。

DB_ROW_ID:行唯一标识(隐式主键)。

2. Undo Log

存储数据的历史版本,形成版本链。

事务回滚时,通过 Undo Log 恢复数据。

3. Read View

包含以下信息:

trx_ids:当前活跃事务 ID 列表。

low_limit_id:生成 Read View 时系统尚未分配的最小事务 ID。

up_limit_id:生成 Read View 时系统已分配的最大事务 ID。

判断数据版本可见性的规则:

若数据版本的 DB_TRX_ID < up_limit_id,说明该版本在事务启动前已提交,可见。

若 DB_TRX_ID >= low_limit_id,说明该版本在事务启动后生成,不可见。

若 DB_TRX_ID 在 trx_ids 列表中且未提交,不可见;否则可见。

MVCC 的隔离级别支持

隔离级别 脏读 不可重复读 幻读 实现机制
读未提交 (RU) 无 MVCC,直接读最新数据
读已提交 (RC) 每次查询生成新 Read View
可重复读 (RR) ✅ 部分 ✅(快照读) 事务内复用同一 Read View + 间隙锁
串行化 (S) 完全依赖锁机制

MVCC 的优缺点

优点

高并发:读操作不阻塞写操作,写操作不阻塞读操作。

避免锁竞争:通过版本链实现无锁读取,提升性能。

支持快照读:提供一致性视图,简化业务逻辑。

缺点

存储开销:需维护多版本数据和 Undo Log。

历史版本清理:需定期清理过期版本(如 MySQL 的 Purge 线程)。

无法完全消除幻读:在 RR 级别下,当前读仍需间隙锁配合。

总结

MVCC 核心:通过多版本和一致性视图实现无锁并发控制。

解决脏读:只读取已提交的版本。

解决不可重复读:事务内复用同一 Read View。

解决幻读:快照读通过版本控制,当前读通过间隙锁。

适用场景:读多写少的高并发系统(如电商、社交平台)。

通过 MVCC,数据库在保证 ACID 特性的同时,显著提升了并发性能,是现代关系型数据库(如 MySQL、PostgreSQL)的核心并发控制机制。

相关推荐
Python私教10 分钟前
Python函数:从基础到进阶的完整指南
java·服务器·python
rit843249926 分钟前
Java中的分布式缓存与Memcached集成实战
java·分布式·缓存
LSL666_31 分钟前
Java——包装类
java·开发语言·包装类
caihuayuan532 分钟前
Vue生命周期&脚手架工程&Element-UI
java·大数据·spring boot·后端·课程设计
yasuniko33 分钟前
C++线程库
开发语言·c++
vvilkim34 分钟前
SQL语言基础:从入门到掌握结构化查询语言
数据库·sql·oracle
@老蝴41 分钟前
C语言—指针2
c语言·开发语言
故事很腻i43 分钟前
RabbitMQ 消息不重复消费和顺序性
java·rabbitmq
明月看潮生1 小时前
青少年编程与数学 02-019 Rust 编程基础 01课题、环境准备
开发语言·青少年编程·rust·编程与数学