MySQL MVCC 介绍

MVCC(Multi-Version Concurrency Control)是一种并发控制机制,用于在多个并发事务同时读写数据库时保持数据的一致性和隔离性。MVCC通过在每个数据行上维护多个版本的数据来实现。当一个事务要对数据库中的数据进行修改时,MVCC不会直接覆盖原始数据,而是创建一个新版本的数据,并将原始数据保留下来,以便其他事务可以继续读取旧版本的数据。

MVCC的实现原理

  1. 事务ID(Transaction ID):每个事务开始时都会被分配一个唯一的事务ID,这个ID是单调递增的,新事务的ID总是大于旧事务的ID。
  2. 隐藏列(Hidden Columns):InnoDB为每一行数据添加了两个隐藏列:DB_TRX_ID和DB_ROLL_PTR。DB_TRX_ID记录创建或最后修改该行的事务ID,DB_ROLL_PTR指向回滚段(Undo Log)中的记录,用于回滚操作。
  3. 回滚段(Undo Log):回滚段存储了旧版本的数据,用于回滚事务和提供一致性读。当事务修改数据时,旧版本的数据会被复制到回滚段中,并通过DB_ROLL_PTR指针链接起来。
  4. Read View:每个事务开始时会创建一个Read View,它包含了当前活动事务的列表。Read View用于确定哪些版本的数据对当前事务是可见的。

MVCC的工作流程

  1. 插入操作:当插入一条新记录时,DB_TRX_ID被设置为当前事务的ID,DB_ROLL_PTR通常为空,因为没有旧版本的数据需要回滚。
  2. 更新操作:当更新一条记录时,InnoDB会将旧版本的数据复制到回滚段中,并通过DB_ROLL_PTR指针链接起来。新版本的记录会被插入到表中,DB_TRX_ID设置为当前事务的ID。
  3. 删除操作:当删除一条记录时,实际上是在记录上标记一个删除标志(逻辑删除),而不是物理删除。DB_TRX_ID设置为当前事务的ID,旧版本的数据同样被复制到回滚段中,并通过DB_ROLL_PTR指针链接起来。
  4. 读取操作:读取操作根据当前事务的Read View来决定哪些版本的数据是可见的。对于每一条记录,InnoDB会检查DB_TRX_ID和Read View中的事务ID列表,以确定是否应该读取当前版本的数据还是从回滚段中读取旧版本的数据。

MVCC的优势

MVCC的主要优势在于它能够在不加锁的情况下支持高并发读写操作,从而提高了系统的整体性能。MVCC通过为每个事务提供一个数据的一致性视图来实现高并发下的事务隔离,使得不同的事务可以在一定程度上并发执行,而不会相互干扰。

MVCC保留几个版本?

MySQL的MVCC(多版本并发控制)机制并没有固定的版本数量限制。MVCC通过在数据库中为每行数据维护多个版本,使得不同的事务可以看到不同版本的数据,从而实现并发事务之间的隔离性。每个事务在执行过程中,看到的数据版本是基于其开始时间点确定的,这样可以避免事务之间的相互干扰。

MVCC机制中版本的数量通常取决于事务的并发程度和数据的修改频率。在高并发环境下,可能会产生较多的版本,但数据库系统会通过垃圾回收机制定期清理不再需要的旧版本数据,以释放空间。

MVCC版本清理机制

  1. 事务结束 :一旦所有需要访问某个旧版本数据的事务都结束了,InnoDB的后台线程会定期清理这些不再需要的旧版本数据,以释放空间6
  2. 长事务影响:如果一个事务长时间不提交,可能会导致大量的旧版本数据无法被清理,从而占用大量空间

事务可见性判断

当一个事务读取某行数据时,数据库系统会根据该事务的开始时间和版本链中的版本信息,确定该事务能够看到的版本。具体的可见性判断规则如下:

  1. 创建时间小于等于事务开始时间:如果一个版本的创建时间小于等于事务的开始时间,且删除时间大于事务的开始时间,那么该版本对该事务是可见的。
  2. 创建时间大于事务开始时间:如果一个版本的创建时间大于事务的开始时间,那么该版本对该事务不可见。
  3. 删除时间小于等于事务开始时间:如果一个版本的删除时间小于等于事务的开始时间,那么该版本对该事务不可见。
相关推荐
好奇的菜鸟2 小时前
如何在IntelliJ IDEA中设置数据库连接全局共享
java·数据库·intellij-idea
tan180°2 小时前
MySQL表的操作(3)
linux·数据库·c++·vscode·后端·mysql
满昕欢喜3 小时前
SQL Server从入门到项目实践(超值版)读书笔记 20
数据库·sql·sqlserver
Hello.Reader4 小时前
Redis 延迟排查与优化全攻略
数据库·redis·缓存
简佐义的博客5 小时前
破解非模式物种GO/KEGG注释难题
开发语言·数据库·后端·oracle·golang
爬山算法5 小时前
MySQL(116)如何监控负载均衡状态?
数据库·mysql·负载均衡
老纪的技术唠嗑局8 小时前
OceanBase PoC 经验总结(二)—— AP 业务
数据库
阿里云大数据AI技术8 小时前
OpenSearch 视频 RAG 实践
数据库·人工智能·llm
m0_6239556610 小时前
Oracle使用SQL一次性向表中插入多行数据
数据库·sql·oracle
阿蒙Amon11 小时前
C#读写文件:多种方式详解
开发语言·数据库·c#