MySQL MVCC 介绍

MVCC(Multi-Version Concurrency Control)是一种并发控制机制,用于在多个并发事务同时读写数据库时保持数据的一致性和隔离性。MVCC通过在每个数据行上维护多个版本的数据来实现。当一个事务要对数据库中的数据进行修改时,MVCC不会直接覆盖原始数据,而是创建一个新版本的数据,并将原始数据保留下来,以便其他事务可以继续读取旧版本的数据。

MVCC的实现原理

  1. 事务ID(Transaction ID):每个事务开始时都会被分配一个唯一的事务ID,这个ID是单调递增的,新事务的ID总是大于旧事务的ID。
  2. 隐藏列(Hidden Columns):InnoDB为每一行数据添加了两个隐藏列:DB_TRX_ID和DB_ROLL_PTR。DB_TRX_ID记录创建或最后修改该行的事务ID,DB_ROLL_PTR指向回滚段(Undo Log)中的记录,用于回滚操作。
  3. 回滚段(Undo Log):回滚段存储了旧版本的数据,用于回滚事务和提供一致性读。当事务修改数据时,旧版本的数据会被复制到回滚段中,并通过DB_ROLL_PTR指针链接起来。
  4. Read View:每个事务开始时会创建一个Read View,它包含了当前活动事务的列表。Read View用于确定哪些版本的数据对当前事务是可见的。

MVCC的工作流程

  1. 插入操作:当插入一条新记录时,DB_TRX_ID被设置为当前事务的ID,DB_ROLL_PTR通常为空,因为没有旧版本的数据需要回滚。
  2. 更新操作:当更新一条记录时,InnoDB会将旧版本的数据复制到回滚段中,并通过DB_ROLL_PTR指针链接起来。新版本的记录会被插入到表中,DB_TRX_ID设置为当前事务的ID。
  3. 删除操作:当删除一条记录时,实际上是在记录上标记一个删除标志(逻辑删除),而不是物理删除。DB_TRX_ID设置为当前事务的ID,旧版本的数据同样被复制到回滚段中,并通过DB_ROLL_PTR指针链接起来。
  4. 读取操作:读取操作根据当前事务的Read View来决定哪些版本的数据是可见的。对于每一条记录,InnoDB会检查DB_TRX_ID和Read View中的事务ID列表,以确定是否应该读取当前版本的数据还是从回滚段中读取旧版本的数据。

MVCC的优势

MVCC的主要优势在于它能够在不加锁的情况下支持高并发读写操作,从而提高了系统的整体性能。MVCC通过为每个事务提供一个数据的一致性视图来实现高并发下的事务隔离,使得不同的事务可以在一定程度上并发执行,而不会相互干扰。

MVCC保留几个版本?

MySQL的MVCC(多版本并发控制)机制并没有固定的版本数量限制。MVCC通过在数据库中为每行数据维护多个版本,使得不同的事务可以看到不同版本的数据,从而实现并发事务之间的隔离性。每个事务在执行过程中,看到的数据版本是基于其开始时间点确定的,这样可以避免事务之间的相互干扰。

MVCC机制中版本的数量通常取决于事务的并发程度和数据的修改频率。在高并发环境下,可能会产生较多的版本,但数据库系统会通过垃圾回收机制定期清理不再需要的旧版本数据,以释放空间。

MVCC版本清理机制

  1. 事务结束 :一旦所有需要访问某个旧版本数据的事务都结束了,InnoDB的后台线程会定期清理这些不再需要的旧版本数据,以释放空间6
  2. 长事务影响:如果一个事务长时间不提交,可能会导致大量的旧版本数据无法被清理,从而占用大量空间

事务可见性判断

当一个事务读取某行数据时,数据库系统会根据该事务的开始时间和版本链中的版本信息,确定该事务能够看到的版本。具体的可见性判断规则如下:

  1. 创建时间小于等于事务开始时间:如果一个版本的创建时间小于等于事务的开始时间,且删除时间大于事务的开始时间,那么该版本对该事务是可见的。
  2. 创建时间大于事务开始时间:如果一个版本的创建时间大于事务的开始时间,那么该版本对该事务不可见。
  3. 删除时间小于等于事务开始时间:如果一个版本的删除时间小于等于事务的开始时间,那么该版本对该事务不可见。
相关推荐
君不见,青丝成雪30 分钟前
Hadoop技术栈(四)HIVE常用函数汇总
大数据·数据库·数据仓库·hive·sql
不羁。。6 小时前
【撸靶笔记】第七关:GET - Dump into outfile - String
数据库·笔记·oracle
yangchanghua1117 小时前
pgsql 如何查询今天范围内的数据(当天0点0分0秒 - 当天23点59分59秒....)
数据库·pgsql
larance7 小时前
SQLAlchemy 的异步操作来批量保存对象列表
数据库·python
python_chai7 小时前
从数据汇总到高级分析,SQL 查询进阶实战(下篇)—— 分组、子查询与窗口函数全攻略
数据库·sql·mysql
在努力的前端小白8 小时前
Spring Boot 敏感词过滤组件实现:基于DFA算法的高效敏感词检测与替换
java·数据库·spring boot·文本处理·敏感词过滤·dfa算法·组件开发
未来之窗软件服务8 小时前
自建知识库,向量数据库 (九)之 量化前奏分词服务——仙盟创梦IDE
数据库·仙盟创梦ide·东方仙盟·自建ai·ai分词
冒泡的肥皂11 小时前
MVCC初学demo(一
数据库·后端·mysql
.Shu.12 小时前
Redis Reactor 模型详解【基本架构、事件循环机制、结合源码详细追踪读写请求从客户端连接到命令执行的完整流程】
数据库·redis·架构
薛晓刚15 小时前
当MySQL的int不够用了
数据库