MVCC 原理

MVCC(Multiversion Concurrency Control,多版本并发控制)是数据库管理系统(DBMS)中 用来实现并发控制的一种技术。它通过为数据库中的数据行创建多个版本,允许多个事务并发执行,并且在保证数据一致性的同时减少锁竞争。

MVCC在事务管理并发控制中扮演着重要角色,尤其是在需要高并发的应用场景中(例如:大规模在交易系统、社交网络、金融系统等)。

一、MVCC的基本概念

MVCC 的核心思想是每个事务看到的是数据的一个特定版本 ,并且每个事务对数据的修改不会影响其他事务,知道该事务提交。在读操作 中,MVCC 允许读取到某个时间点的数据快照 ,而写操作不会阻塞读操作,反之亦然。这种机制使得事务之间能够并行执行,提高了数据库的吞吐量。

二、MVCC 的工作原理

MVCC 通过多版本的数据存储 来实现高并发控制,具体过程如下:

1、事务标识 :每个事务都会被分配一个唯一的标识符(通常是时间戳或序列号),用于标记该事务开始时的数据版本。

2、版本控制:数据库中的每一行数据会保存多个版本,每个版本都包含:

  • 数据的实际内容。

  • 该数据版本的创建时间戳或事务id。

  • 数据的删除时间戳或事务id(如果该数据已经被删除)。

    3、读取数据时的快照

    当事务执行读操作时,系统会根据事务的标识符,选择一个合适的数据版本来返回。事务只能看到在它开始真会玩提交的事务的修改结果。

  • 可重复读(Repeatable Read):MVCC 确保同一事务在不同时间读取相同数据时,总是读取相同的版本,即使其他事务对该数据进行了修改或提交

4、写操作时的并发性:当事务进行写操作时,系统会创建该数据的新版本,而不会直接修改现有数据。只有当事务提交后,新版本的数据才会对其他事务可见。

  • 写时复制(Copy-on-write):为了不影响其他事务,更新操作通常会创建数据的新版本,而不会直接覆盖旧版本。

5、事务提交与回滚

提交 :当事务提交时,它的修改会成为数据库中新的版本,并且可以被其他事务看到。
回滚:如果事务回滚,则它对数据的修改会被丢弃,其他事务依然会看到事务开始时的数据版本。

三、MVCC 的优势

1、提高并发性 :由于读操作不需要加锁,读操作与写操作可以并行执行,极大地提高了数据库的病发性能。

2、避免读写锁冲突 :使用多版本的数据存储机制,避免了读操作与写操作之间的锁竞争。这样,读取操作不会被写操作阻塞,反之亦然。

3、提供一致性 :通过事务标识符和版本控制,MVCC 保证了每个事务的可见性,并确保事务之间的数据隔离性,尤其是在高并发环境下,能共保证事务的可重复度和串行化隔离性。

4、实现了更高效的并发控制:MVCC 能够通过非阻塞的方式来管理并发事务,减少了锁竞争,提高了数据库的吞吐量。

四、MVCC 缺点

1、存储开销 :由于每个数据行都需要存储多个版本,因此MVCC 会增加一定的存储空间需求。

2、版本清理 :随着时间的推移,数据库中可能会有大量过期或不再使用的数据版本(以提交事务的历史版本)。这些无用版本需要定期清理,否则会浪费大量的存储空间。

3、复杂性:MVCC 的实现相对比较复杂,涉及事务管理、版本控制、垃圾回收等机制,可能会增加数据库的管理和维护难度。

五、MVCC 在不同数据库中实现

不同的数据库系统采用不同的方式来实现MVCC。以下是几个常见数据库中的MVCC 实现方式:

1、MySQl(InnoDB存储引擎)

  • 在 InnoDB 中,MVCC 通过 隐式版本控制 来实现,每行数据有两个隐藏的列:一个表示事务开始时的版本(DB_TRX_ID),另一个表示事务结束时的版本(DB_ROLL_PTR)。这些列帮助 InnoDB 判断哪些数据是当前事务可见的,哪些是已经过时的。

  • 通过 Undo Log 存储旧版本数据,确保事务回滚时能够恢复原始数据。

2、PostgreSQL

  • PostgreSQL 也使用 MVCC 来实现高并发支持。每行数据存储有 事务 ID,并通过 XMIN 和 XMAX 字段来标记数据版本的创建和删除状态。

  • PostgreSQL 通过 Vacuum 过程定期清理过期版本,回收不再需要的空间。

3、Oracle

  • Oracle 使用 Flashback 技术来实现 MVCC,通过存储每个数据行的历史版本来支持快照读(Snapshot Read)。

  • Oracle 通过使用 Undo Segment 来存储旧数据版本,并在事务回滚时恢复数据。

六、MVCC 与其他并发控制技术的比较
并发控制技术 MVCC 锁机制
基本思想 使用多个数据版本来控制并发 通过加锁来确保数据一致性
读操作性能 读取不阻塞,多个事务可以并发读取 读操作可能会被写操作阻塞
写操作性能 写操作创建新的数据版本 写操作可能会阻塞其他事务
适用场景 高并发环境,尤其适用于读多写少的场景 适用于需要强隔离性和一致性的事务场景
七、总结

MVCC(多版本并发控制) 是一种高效的数据库并发控制技术,它通过为每行数据创建多个版本,允许多个事务并发执行,同时避免了读写冲突。MVCC 提高了数据库的并发性能,并且保证了数据的一致性和事务隔离性。尽管它需要额外的存储空间,并可能增加版本管理的复杂性,但在高并发应用中,它能够显著提升数据库的性能和响应能力。

相关推荐
翼龙云_cloud4 小时前
阿里云渠道商:轻量服务器远程协作性能优化指南
运维·服务器·阿里云·性能优化·云计算
菜鸡的升级之路4 小时前
服务器卡死排查流程
运维·服务器
恒创科技HK4 小时前
租用日本服务器价格便宜的原因
运维·服务器
FreeBuf_4 小时前
新型PCPcat恶意软件利用React2Shell漏洞48小时内入侵超5.9万台服务器
运维·服务器
期待のcode9 小时前
MyBatisX插件
java·数据库·后端·mybatis·springboot
AI浩11 小时前
【Labelme数据操作】LabelMe标注批量复制工具 - 完整教程
运维·服务器·前端
安审若无11 小时前
oracel迁移数据文件至其他目录操作步骤
数据库
sunxunyong11 小时前
doris运维命令
java·运维·数据库
Guheyunyi11 小时前
智慧消防管理系统如何重塑安全未来
大数据·运维·服务器·人工智能·安全