Mysql中MVCC的流程

一、核心概念

表中每行数据的3个隐式字段:

  1. 事务ID(Transaction ID)
    DB_TRX_ID:每行记录都有一个隐藏字段 DB_TRX_ID(6字节),记录最后修改该行数据的事务ID(是修改的事务ID,不管修改有没有提交,只要是修改了,那么就是谁的事务ID), 事务ID是全局自增的,新事务会获得一个比之前所有事务都大的ID
  2. 回滚指针(Rollback Pointer)
    DB_ROLL_PTR:另一个隐藏字段(7字节),指向该行数据在 undo log 中的历史版本, 形成一条版本链,可以追溯到数据的各个历史状态
  3. Read View(读视图)
    当事务执行快照读(普通SELECT)时,会生成一个Read View,

包含:

java 复制代码
1、creator_trx_id:创建此Read View的事务ID,如果是快照读创建的是一个虚拟线程。
2、m_ids:生成Read View时,系统中活跃(未提交)的事务ID集合
3、min_trx_id:m_ids中的最小值
4、max_trx_id:下一个将要分配的事务ID(当前最大事务ID+1)


ReadV iew包含的内容 {
    creator_trx_id,  // 创建者事务ID(虚拟或真实)
    m_ids[],         // 活跃事务ID列表
    min_trx_id,      // 最小活跃事务ID
    max_trx_id       // 下一个将分配的事务ID
}

流程:

java 复制代码
-- 初始数据: id=1, balance=1000 (TRX_ID=100, 已提交)

-- 时间线:
T1: 事务200开始, UPDATE → balance=800 (未提交)
T2: 事务300开始, UPDATE → balance=600 (已提交)  
T3: 事务400开始, UPDATE → balance=400 (未提交)
T4: 事务500执行SELECT查询(快照读)  为什么事务是从400开始,不应该是从100开始算吗? 这里有个误解就是,没提交的事务,也会刷到数据页中,可以看下面的问题3。

-- 版本链:

java 复制代码
v4(TRX_ID=400, balance=400) 
← v3(TRX_ID=300, balance=600) 
← v2(TRX_ID=200, balance=800) 
← v1(TRX_ID=100, balance=1000)

事务500的Read View和判断过程

java 复制代码
事务500创建:Read View:
1、creator_trx_id= 500 (或虚拟ID)
2、m_ids= [200, 400]  (活跃事务:200和400,300已提交)
3、min_trx_id= 200
4、max_trx_id= 501
java 复制代码
1、遍历判断过程:
检查v4 (TRX_ID=400):
400 ∈ m_ids [200,400] → 活跃事务 → 不可见
沿ROLL_PTR找v3

2、检查v3 (TRX_ID=300):
300 ∉ m_ids [200,400] → 不在活跃列表
min_trx_id=200 ≤ 300 < max_trx_id=501 → 在范围内
不在活跃列表中 → 可见
返回v3的数据:balance=600

问题:

1、如果2个快照读的线程并发过来,二者在同一个时刻创建Read View,那么Read View里面的内容是不是一样的?

是的。每来一个快照读都会创建一个Read View。

2、只要开启事务,不管有没有提交,都会出现在版本链中吗?

开启了事务,并不会直接记录到版本链中,只有修改了数据,不管是有提交还是没提交,都会在版本链中。

3、行数据中,隐藏事务ID,一定是事务提交的吗?

不一定,如果事务未提交,也会直接刷到数据页中,这个和以往我们的认知有差异的。

也就是说:DB_TRX_ID 的真实含义,DB_TRX_ID 记录的是"最后修改者",不是"最后提交者":

例子

java 复制代码
修改前数据行: 
id=1, balance=1000, DB_TRX_ID=100, DB_ROLL_PTR=0x1234

修改后(事务200未提交)数据行: 
id=1, balance=800, DB_TRX_ID=200, DB_ROLL_PTR=0x5678
Undo Log: balance=1000, DB_TRX_ID=100, DB_ROLL_PTR=0x1234

为什么这样设计?

java 复制代码
-- 传统数据库的写法(不是InnoDB):
-- 1. 拷贝数据到临时区域
-- 2. 修改临时副本
-- 3. 事务提交时替换原数据

-- InnoDB的实际做法:
-- 1. 立即在数据页上修改(创建新版本)
-- 2. 旧版本进入Undo Log
-- 3. MVCC机制控制可见性

性能优化,立即修改数据页的好处:

减少内存拷贝:避免数据来回拷贝

利用缓存局部性:直接修改缓冲池中的数据

简化恢复机制:Redo Log只需记录物理变化

崩溃恢复的考虑

java 复制代码
// 崩溃恢复时,检查数据行的DB_TRX_ID
if (row->DB_TRX_ID对应的事务未提交) {
    // 使用Undo Log回滚修改
    rollback_row_using_undo_log(row);
} else {
    // 事务已提交,数据有效
    keep_row_changes(row);
}
怎么避免读到事务200修改的数据800,通过MVCC。
相关推荐
qq_124987075312 分钟前
基于JavaWeb的大学生房屋租赁系统(源码+论文+部署+安装)
java·数据库·人工智能·spring boot·计算机视觉·毕业设计·计算机毕业设计
倒流时光三十年44 分钟前
SpringBoot 数据库同步 Elasticsearch 性能优化
数据库·spring boot·elasticsearch
码农小卡拉1 小时前
深入解析Spring Boot文件加载顺序与加载方式
java·数据库·spring boot
怣501 小时前
MySQL多表连接:全外连接、交叉连接与结果集合并详解
数据库·sql
wjhx2 小时前
QT中对蓝牙权限的申请,整理一下
java·数据库·qt
冰暮流星2 小时前
javascript之二重循环练习
开发语言·javascript·数据库
万岳科技系统开发2 小时前
食堂采购系统源码库存扣减算法与并发控制实现详解
java·前端·数据库·算法
冉冰学姐2 小时前
SSM智慧社区管理系统jby69(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面
数据库·管理系统·智慧社区·ssm 框架
杨超越luckly2 小时前
HTML应用指南:利用GET请求获取中国500强企业名单,揭秘企业增长、分化与转型的新常态
前端·数据库·html·可视化·中国500强
斯普信专业组3 小时前
构建基于MCP的MySQL智能运维平台:从开源服务端到交互式AI助手
运维·mysql·开源·mcp