MySQL 学习二 MVCC

MVCC是多版本并发控制。目的是让读写能够并发。

是innodb通过undo log记录数据变更的版本信息实现的。

每个事务读到的版本是不一致的。同一个事务中,用户只能看到当前事务中创建的快照的内容(在事务开始之前就已经存在的数据),以及事务本身的操作。

MVCC的使用场景:在事务隔离级别读已提交和可重复读才会使用到。

读已提交:

可重复读:整个事务中,每次读取数据都用的是同一个read view。

1.MVCC的实现原理

三个方面:

1 隐藏字段

2 undo log

3 read view

2.隐藏字段

DB_TRX_ID 对数据进行新增或修改的最后一条事务id(删除视为修改)。事务id是递增的。

DB_ROLL_PTR 滚动指针,指向写入回滚段的撤销日志记录。Undo log中记录的多个版本之间用这个指针相连。

DB_ROW_ID 行id,如果表中没有主键,没有唯一非空索引。则mysql会自动将这个字段作为聚簇索引。(这个字段与MVCC实现相关不大)

3.Undo log的存储结构

场景:

当有一个事务要修改数据。

第一步:获取排他锁。

第二步:将当前数据行复制到undo log中,作为旧版本。

第三部:复制完之后,修改改数据,并且trx_id递增,并将roll_ptr指向undo_log中的旧版本。

4.Read view

Read view是读操作可见性(判断某个版本的数据是否对当前事务可见)判断的核心。Read view存储在内存中,不会写到磁盘上。

创建时机:在事务开启后第一个select开启,才会去创建read view。

在read view中可能会出现不应该被当前事务看到的其他活跃的事务列表。因为活跃的事务还没有提交,所以活跃的事务的数据,当前事务是不能看的。

当用户读取某一行数据时,会将数据的rtx_id与read view中的一些数据进行比较。

Read view中的关键数据:

m_creator_trx_id:创建该Read View的事务ID。

m_ids:创建Read View时系统中所有未提交的事务ID集合(活跃事务列表),不包含当前事务Id。

min_trx_id:m_ids中的最小事务ID,表示最早未提交的事务。

max_trx_id:创建Read View时系统将分配的下一个事务ID(即当前最大事务ID + 1)。

可见性规则:

若数据的DB_TRX_ID(记录最近修改的事务ID)等于m_creator_trx_id,说明是当前事务修改的,可见。

若DB_TRX_ID < min_trx_id,说明数据的当前版本在Read View创建前已提交(上一次造成数据修改的事务已经提交了),可见。

若DB_TRX_ID ≥ max_trx_id,说明数据的当前版本在Read View创建后生成(当前造成数据修改的事务实在read view生成之后开始的,而当前事务要读取的肯定是在造成数据修改事务之前的版本),不可见。

若min_trx_id ≤ DB_TRX_ID < max_trx_id:若DB_TRX_ID在m_ids中,说明该版本未提交,不可见。否则,说明该版本已提交,可见。

如果数据的当前版本不可见,那么沿着undo log中的版本链查看数据的上一个版本是否可见,直到版本可见或者版本链到头。

相关推荐
小兔崽子去哪了4 分钟前
Docker 安装 PostgreSQL
数据库·后端·postgresql
野犬寒鸦9 分钟前
Redis热点key问题解析与实战解决方案(附大厂实际方案讲解)
服务器·数据库·redis·后端·缓存·bootstrap
开源盛世!!24 分钟前
3.26-3.27学习笔记
笔记·学习
mldlds33 分钟前
Windows安装Redis图文教程
数据库·windows·redis
Y001112361 小时前
JDBC原理
java·开发语言·数据库·jdbc
超级大只老咪1 小时前
固定个数的状态,需要按顺序无限循环切换
数据库
@insist1231 小时前
数据库系统工程师-云计算与大数据核心知识
大数据·数据库·云计算·软考·数据库系统工程师·软件水平考试
皙然2 小时前
深度解析:关系型数据库与非关系型数据库(区别+原理+适用场景,一文吃透)
数据库·nosql
我的xiaodoujiao2 小时前
API 接口自动化测试详细图文教程学习系列7--相关Python基础知识6
python·学习·测试工具·pytest