【MySQL】事务管理

文章目录

  • [1. CURD 不加控制,会有什么问题?](#1. CURD 不加控制,会有什么问题?)
  • [2. 什么是事务?](#2. 什么是事务?)
  • [3. 为什么会出现事务](#3. 为什么会出现事务)
  • [4. 事务的版本支持](#4. 事务的版本支持)
  • [5. 事务提交方式](#5. 事务提交方式)
  • [6. 事务常见操作方式](#6. 事务常见操作方式)
    • [6.1 证明事务的开始与回滚(正常演示)](#6.1 证明事务的开始与回滚(正常演示))
    • [6.2 证明未commit,客户端崩溃,MySQL自动会回滚](#6.2 证明未commit,客户端崩溃,MySQL自动会回滚)
    • [6.3 证明 commit 了,客户端崩溃,MySQL 数据不会在受影响,已经持久化](#6.3 证明 commit 了,客户端崩溃,MySQL 数据不会在受影响,已经持久化)
    • [6.4 证明 begin 操作会自动更改提交方式,不会受 MySQL 是否自动提交影响](#6.4 证明 begin 操作会自动更改提交方式,不会受 MySQL 是否自动提交影响)
    • [6.5 证明单条 SQL 与事务的关系](#6.5 证明单条 SQL 与事务的关系)
    • [6.6 结论](#6.6 结论)
  • [7. 事务隔离级别](#7. 事务隔离级别)
    • [7.1 如何理解隔离性](#7.1 如何理解隔离性)
    • [7.2 隔离级别](#7.2 隔离级别)
    • [7.3 隔离级别的设置与查看](#7.3 隔离级别的设置与查看)
      • [7.3.1 查看](#7.3.1 查看)
      • [7.3.2 设置](#7.3.2 设置)
    • [7.4 读未提交【Read Uncommitted】](#7.4 读未提交【Read Uncommitted】)
    • [7.5 读提交【Read Committed】](#7.5 读提交【Read Committed】)
    • [7.6 可重复读【Repeatable Read】](#7.6 可重复读【Repeatable Read】)
    • [7.7 串行化【serializable】](#7.7 串行化【serializable】)
    • [7.8 一致性(Consistency)](#7.8 一致性(Consistency))
  • [8. 多版本并发控制(MVCC)](#8. 多版本并发控制(MVCC))
    • [8.1 读 - 写](#8.1 读 - 写)
    • [8.2 三个记录隐藏字段](#8.2 三个记录隐藏字段)
    • [8.3 undo 日志](#8.3 undo 日志)
    • [8.4 模拟 MVCC](#8.4 模拟 MVCC)
  • [9. 总结](#9. 总结)
    • [9.1 为什么不同事务可以对同一条记录读写并发?](#9.1 为什么不同事务可以对同一条记录读写并发?)
    • [9.2 为什么 A 事务已提交,但 B 事务仍然读不到最新数据?](#9.2 为什么 A 事务已提交,但 B 事务仍然读不到最新数据?)
    • [9.3 RC 和 RR 隔离级别下,能否看到其他事务的提交,本质区别是什么?](#9.3 RC 和 RR 隔离级别下,能否看到其他事务的提交,本质区别是什么?)
    • [9.4 为什么事务可以回滚(rollback)?](#9.4 为什么事务可以回滚(rollback)?)

事务就是由一条或者多条 SQL 共同构成的一个 SQL 的集合体,这个集合体合在一起共同要完成某种任务,这就叫做事务。

事务是有运行过程的,既然有过程,那么一定会涉及到并发,而 MySQL 为了解决在运行过程中交叉的问题,才诞生出了事务当中各种各样的特性。

1. CURD 不加控制,会有什么问题?

有下面这样一个场景:

当客户端 A 检查还有一张票时,将票卖掉,还没有执行更新数据库时,客户端 B 检查了票数,发现大于 0,于是又卖了一次票。然后 A 将票数更新回数据库。

这时就出现了同一张票被卖了两次。

那么思考一下:我们的 CURD 操作必须满足什么属性,才能解决上述问题呢?

  • 买票的过程必须是原子的;
  • 买票互相之间不能影响;
  • 买完票要永久有效;
  • 买票前和买票后都要是确定的状态。

2. 什么是事务?

事务就是一组 DML 语句组成,这些语句在逻辑上存在相关性,这一组 DML 语句要么全部成功,要么全部

失败,它是一个整体。MySQL 提供一种机制,保证我们达到这样的效果,同时,事务还规定不同的客户端看到的

数据是不相同的。

事务就是要做的或所做的事情,主要用于处理操作量大、复杂度高的数据。

假设一种场景:你毕业了,学校的教务系统后台 MySQL 中,不再需要你的数据,要删除你的所有信息(一般情况下不会):

  • 删除你的基本信息,比如:姓名、电话、籍贯等;
  • 删除和你有关的其他信息,比如:你的各科成绩、你在校表现、甚至你在论坛发过的文章等;
  • 这样,就需要多条 MySQL 语句构成,那么所有这些操作合起来,就构
    成了一个事务。

换言之,事务就是由一条或者多条 SQL 共同构成的一个 SQL 的集合体,这个集合体合在一起共同要完成某种任务。

正如我们上面所说,一个 MySQL 数据库,可不止你一个事务在运行,同一时刻,甚至有大量的请求被包装成事务,在向 MySQL 服务器发起事务处理请求。

而每条事务至少需要一条 SQL,最多需要很多SQL,这样如果大家都访问同样的表数据,在不加保护的情况,就绝对会出现问题。

甚至,因为事务由多条 SQL 构成,那么,也会存在执行到一半出错或者不想再执行的情况,那么已经执行的怎么办呢?

所有,一个完整的事务,绝对不是简单的 SQL 集合,还需要满足如下四个属性:

  • 原子性:一个事务(transaction)中的所有操作,要么全部完成,要么全部不完成,不会结束在中间某个环节。事务在执行过程中发生错误,会被回滚(Rollback)到事务开始前的状态,就像这个事务从来没有执行过一样。
  • 一致性:在事务开始之前和事务结束以后,数据库的完整性没有被破坏。这表示写入的资料必须完全符合所有的预设规则,这包含资料的精确度、串联性以及后续数据库可以自发性地完成预定的工作。
  • 隔离性 :数据库允许多个并发事务同时对其数据进行读写和修改的能力,隔离性可以防止多个事务并发执行时由于交叉执行而导致数据的不一致。事务隔离分为如下四个不同级别,
    • 读未提交 Read uncommitted
    • 读提交 read committed
    • 可重复读 repeatable read
    • 串行化 Serializable
  • 持久性:事务处理结束后,对数据的修改就是永久的,即便系统故障也不会丢失。

上面四个属性,可以简称为 ACID:

  • 原子性(Atomicity,或称不可分割性)
  • 一致性(Consistency)
  • 隔离性(Isolation,又称独立性)
  • 持久性(Durability)

3. 为什么会出现事务

事务被 MySQL 编写者设计出来,本质是为了:

  • 当应用程序访问数据库的时候,事务能够简化我们的编程模型,不需要我们去考虑各种各样的潜在错误和并发问题;
  • 可以想一下当我们使用事务时,要么提交,要么回滚。我们不会去考虑网络异常了,服务器宕机了,同时更改一个数据怎么办对吧?
  • 因此事务本质上是为了应用层服务的,而不是伴随着数据库系统天生就有的。

注意:我们后面把 MySQL 中的一行信息,称为一行记录。

4. 事务的版本支持

在 MySQL 中只有使用了 Innodb 数据库引擎的数据库或表才支持事务,MyISAM 不支持。

查看数据库引擎:

sql 复制代码
-- 按行显示
show engines\G

结果如下:

5. 事务提交方式

事务的提交方式常见的有两种:

  • 自动提交
  • 手动提交

查看事务提交方式:

sql 复制代码
mysql> show variables like 'autocommit';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| autocommit    | ON    |
+---------------+-------+
1 row in set (0.01 sec)

SET 来改变 MySQL 的自动提交模式。

  • SET AUTOCOMMIT=0 禁止自动提交
sql 复制代码
SET AUTOCOMMIT=0;

结果如下:

  • SET AUTOCOMMIT=1 开启自动提交
sql 复制代码
SET AUTOCOMMIT=1;

结果如下:

6. 事务常见操作方式

首先,在云服务器上查看是否默认开启 3306 mysqld 服务,使用 netstat 查看链接情况,可知:mysql 本质是一个客户端进程

为了便于演示,我们将 MySQL 的默认隔离级别设置成 读未提交 Read uncommitted

sql 复制代码
set global transaction isolation level READ UNCOMMITTED;

此时需要 重启终端 才能生效,然后进行查看

sql 复制代码
select @@tx_isolation;

结果如下:

我们接下来的实验会打开两个命令行窗口,然后分别各自登录 MySQL,然后来充当两个并发访问 MySQL 服务的客户端,所以我们必须要把隔离级别调到最低(Read uncommitted),这样的话,A 客户端进行了操作以后,B 客户端就立马能看到。如果不调的话,可能 A 客户端操作完了,B 客户端都还无法看到。

  • 创建测试表
sql 复制代码
create table if not exists account(
id int primary key, 
name varchar(50) not null default '', 
blance decimal(10,2) not null default 0.0
)ENGINE=InnoDB DEFAULT CHARSET=UTF8;

结果如下:

6.1 证明事务的开始与回滚(正常演示)

  • 先查看事务是否自动提交。我们故意设置成自动提交,看看该选项是否影响 begin
sql 复制代码
show variables like 'autocommit'; 

结果如下:

  • 然后分别在 A 客户端和 B 客户端启动一个事务
sql 复制代码
start transaction;

或者

begin;

结果如下:

  • 然后在 A 客户端创建一个保存点 save1
sql 复制代码
savepoint save1;

在 B 客户端可以看到,此时咱们的 account 表是为空的:

  • 接着,在 A 客户端中插入一条记录
sql 复制代码
insert into account values (1, '张三', 1234.5);

然后在 B 客户端中可以看到插入的数据:

  • 然后在 A 客户端中再设置一个保存点 save2,并插入一条记录
sql 复制代码
savepoint save2;
insert into account values (2, '李四', 10000); 

此时可以在 B 客户端中查看一下:

  • 继续在 A 客户端中再设置一个保存点 save3,并插入一条记录
sql 复制代码
savepoint save3;
insert into account values (3, '王五', 4321.5); 

在 B 客户端中查看一下:

  • 假设我现在不想要 王五 这条记录了,那么可以回滚到保存点 save3
sql 复制代码
rollback to save3;

此时,可以看到 王五 这条记录已经没有了

  • 此时,还可以直接 rollback,回滚到最开始的状态
sql 复制代码
rollback;

可以看到刚刚所有的记录没有了

  • 那么如果我想结束掉 A 客户端的事务,直接 commit 即可
sql 复制代码
commit;

结果如下:

  • 重新在 A 客户端和 B 客户端启动事务
sql 复制代码
begin;

然后在 A 客户端插入 3 条记录,并直接提交 commit

sql 复制代码
insert into account values (1, '张三', 1234.5);
insert into account values (2, '李四', 10000);
insert into account values (3, '王五', 4321.5);

commit;

我们可以在事务运行期间进行回滚,一旦事务提交之后,就无法回滚,那么插入的记录也就被永久保存了

6.2 证明未commit,客户端崩溃,MySQL自动会回滚

  • 当前表内有数据,并且隔离级别依旧设置为读未提交
  • 在 A 客户端和 B 客户端启动事务
sql 复制代码
begin;
  • 然后在 A 客户端插入一条记录
sql 复制代码
insert into account values (4, '赵六', 6543.8);

数据已经存在,但没有 commit,此时在 B 客户端查看

然后在 A 客户端中,输入:ctrl + \ 异常终止 MySQL

sql 复制代码
ctrl + \

可以看到 A 客户端崩溃了,并且数据自动回滚到插入 赵六 这条记录之前了。

故,MySQL 碰到异常情况的话,事务会自动回滚(保持原子性)。

6.3 证明 commit 了,客户端崩溃,MySQL 数据不会在受影响,已经持久化

只要你把事务统一 commit 了,那么这条记录就会被直接插入到 test_db 数据库中了,此时,并不会因为你的客户端出现【崩溃 / 异常】而导致数据回滚。

commit 之前随时回滚,commit 之后无法回滚。

6.4 证明 begin 操作会自动更改提交方式,不会受 MySQL 是否自动提交影响

  • 查看历史数据
sql 复制代码
select * from account;

结果如下:

  • 查看事务提交方式
sql 复制代码
show variables like 'autocommit';

结果如下:

  • 关闭自动提交
sql 复制代码
set autocommit=0; 

查看关闭之后结果:

  • 在 A 客户端和 B 客户端启动事务
sql 复制代码
begin;
  • 然后在 A 客户端插入一条记录
sql 复制代码
insert into account values (5, '荣世旺', 8765.2);

查看插入记录,同时查看 B 客户端:

然后在 A 客户端中输入 ctrl + \ 异常终止 MySQL

然后重新登录 A 客户端,开启事务,插入一条记录,再 commit

可以看到,自动提交开启与否,并不影响 begin

6.5 证明单条 SQL 与事务的关系

实验一

  • 先关闭自动提交:
  • 然后开启事务,并在 B 客户端中查询表里面的数据:
  • 接着在 A 客户端中删除 id = 5 这条记录,并提交,然后在 B 客户端中查看:
  • 当我们 commit 完以后,事务已经结束了,那么我们又在 A 客户端中删除 id = 2 这条记录:
  • 然后我们异常终止掉 A 客户端,此时再去 B 客户端查询表中的内容,可以看到 id = 2 这条记录又回来了:

实验二:

  • 两个客户端都开启默认提交:
  • 然后在 A 客户端中删除 id = 1 的这条记录:
  • 然后再异常终止掉 A 客户端,故可以看到:
    • A 客户端崩溃前和崩溃后,并不影响,因为已经持久化,autocommit 起作用了。

6.6 结论

结论如下:

  • 只要输入 begin 或者 start transaction,事务便必须要通过 commit 提交,才会持久化,与 是否 设置 set autocommit 无关;
  • 事务可以手动回滚,同时,当操作异常,MySQL 会自动回滚;
  • 对于 InnoDB 每一条 SQL 语言都默认封装成事务,自动提交(select 有特殊情况,因为 MySQL 有 MVCC);
  • 从上面的例子,我们能看到事务本身的原子性(回滚)、持久性(commit);

事务操作注意事项:

  • 如果没有设置保存点,也可以回滚,直接使用 rollback,但只能回滚到事务的开始(前提是事务还没有提交);
  • 如果一个事务被提交了(commit),则不可以回滚(rollback);
  • 可以选择回退到设置的某个保存点;
  • InnoDB 支持事务,MyISAM 不支持事务;
  • 开始事务可以使用 start transaction 或者 begin,结束事务使用 commit

7. 事务隔离级别

7.1 如何理解隔离性

  • MySQL 服务可能会同时被多个客户端进程(线程)访问,访问的方式以事务方式进行;
  • 一个事务可能由多条 SQL 构成,也就意味着,任何一个事务,都有执行前,执行中,执行后的阶段。而所谓的原子性,其实就是让用户层,要么看到执行前,要么看到执行后。执行中出现问题,可以随时回滚。所以单个事务,对用户表现出来的特性,就是原子性。
  • 但,毕竟所有事务都要有个执行过程,那么在多个事务各自执行多个 SQL 的时候,就还是有可能会出现互相影响的情况。比如:多个事务同时访问同一张表,甚至同一行数据。
  • 就如同你妈妈给你说:你要么别学,要学就学到最好。至于你怎么学,中间有什么困难,你妈妈不关心。那么你的学习,对你妈妈来讲,就是原子的。那么你学习过程中,很容易受别人干扰,此时,就需要将你的学习隔离开,保证你的学习环境是健康的。
  • 数据库中,为了保证事务执行过程中尽量不受干扰,就有了一个重要特征:隔离性
  • 数据库中,允许事务受不同程度的干扰,就有了一种重要特征:隔离级别

7.2 隔离级别

  • 读未提交【Read Uncommitted】:在该隔离级别,所有的事务都可以看到其他事务没有提交的执行结果。(实际生产中不可能使用这种隔离级别的),但是相当于没有任何隔离性,也会有很多并发问题,如脏读,幻读,不可重复读等,我们上面为了做实验方便,用的就是这个隔离性。
  • 读提交【Read Committed】:该隔离级别是大多数数据库的默认的隔离级别(不是 MySQL 默认的)。它满足了隔离的简单定义:一个事务只能看到其他的已经提交的事务所做的改变。这种隔离级别会引起不可重复读,即一个事务执行时,如果多次 select,可能得到不同的结果。
  • 可重复读【Repeatable Read】:这是 MySQL 默认的隔离级别,它确保同一个事务,在执行中,多次读取操作数据时,会看到同样的数据行。但是会有幻读问题。
  • 串行化【Serializable】:这是事务的最高隔离级别,它通过强制事务排序,使之不可能相互冲突,从而解决了幻读的问题。它在每个读的数据行上面加上共享锁,。但是可能会导致超时和锁竞争(这种隔离级别太极端,实际生产基本不使用)

隔离级别如何实现:隔离,基本都是通过锁实现的,不同的隔离级别,锁的使用是不同的。常见有,表锁,行锁,读锁,写锁,间隙锁(GAP),Next-Key 锁(GAP + 行锁)等。不过,我们目前现有这个认识就行,先关注上层使用。

故,我们可以进行总结:

  • 隔离是必要的,【隔离性】是为了保证事务执行过程中,互相尽量不要受到干扰。那么根据干扰的程度的不同,就有了【隔离级别】,那么在 MySQL 读写并发的场景中,【隔离级别】一共有四种:读未提交、读提交、可重复读、串行化。

7.3 隔离级别的设置与查看

7.3.1 查看

  • 查看全局隔级别
sql 复制代码
select @@global.tx_isolation;

结果如下:这是我们上面最开始设置的【读未提交】,默认不是这个。

  • 查看会话(当前)全局隔级别
sql 复制代码
select @@session.tx_isolation;

结果如下:

  • 还查看会话(当前)全局隔级别(去掉 session
sql 复制代码
select @@tx_isolation;

结果如下:

7.3.2 设置

  • 设置当前会话 / 全局隔离级别语法
sql 复制代码
SET [SESSION | GLOBAL] TRANSACTION ISOLATION LEVEL {READ UNCOMMITTED | READ COMMITTED | REPEATABLE READ | SERIALIZABLE}

实验一:设置当前会话隔离性。

在 A 客户端中设置当前会话隔离级别为:READ COMMITTED

sql 复制代码
set session transaction isolation level read committed;

并且我们查看隔离级别可以看到,全局未受到影响:

并且 B 客户端完全没有收到影响,隔离级别都是【读未提交】

注意:MySQL 一般的隔离级别会采用【就近原则】,也就是优先采用 session 的隔离级别。

实验二:设置全局隔离性,另起一个会话,会被影响。

在 A 客户端中设置全局隔离级别为:SERIALIZABLE

sql 复制代码
set global transaction isolation level SERIALIZABLE;

可以看到,全局隔离级别已经收到影响:

并且 B 客户端的全局隔离级别也会收到影响:

如果当我们在 A 客户端退出 MySQL,再重新登录的话,可以看到 MySQL 的【当前会话 session】和【默认】都使用了刚刚设置好的全局隔离级别 SERIALIZABLE 来进行初始化设置,如下所示:

故,综上所述:

  • 如果设置会话隔离级别,那么只会影响自己,不会影响到其他 MySQL 客户端;
  • 如果设置全局隔离性的话,那么重新启动 MySQL 客户端,此时当前【会话】也会受到影响。

7.4 读未提交【Read Uncommitted】

把 A 客户端的【全局】隔离级别设置为:read uncommitted

sql 复制代码
set global transaction isolation level read uncommitted;

结果如下:

然后重启客户端,使其【默认会话】隔离级别生效:

然后确保 B 客户端的隔离级别和 A 客户端一样:

然后手动开启 A、B 客户端的事务,使其并发执行:

sql 复制代码
begin;

结果如下:

然后在 A 客户端中插入一条记录:

sql 复制代码
insert into account values (1, '张三', 4321);

可以看到 B 客户端读到了 A 客户端还没有提交的记录,故这就是所谓的:读未提交

那么我们可以在 A 客户端中进行【回滚】操作:

在【读未提交】的隔离级别之下,几乎没有加锁,虽然效率高,但是问题太多,严重不建议采用,并且一个事务在执行中,读到另一个执行中事务的更新(或其他操作)但是未 commit 的数据,这种现象叫做 脏读(dirty read)

7.5 读提交【Read Committed】

把 A 客户端的【全局】隔离级别设置为:read committed

sql 复制代码
set global transaction isolation level read committed;

结果如下:

然后重启客户端,并且确保 A、B 客户端的隔离级别都是 read committed

在 A、B 客户端手动的开启事务(此时这两个事务是在运行中的):

然后在 A 客户端中插入一条记录:

然后在 A 客户端中修改一条记录:

可以看到,不管是插入还是删除记录,那么 A、B 客户端在各自的事务内部,看到的数据是不一样的。

然后在 A 客户端中进行 commit,此时在 B 客户端中就能查看到 A 客户端进行【插入和修改】的记录:

注意,此时 B 客户端还在当前事务中,并未 commit 提交,那么就造成了,在 B 客户端事务内部,同样的读取,在不同的时间段(依旧还在事务操作中),读取到了不同的值,这种现象叫做 不可重复读(non reapeatable read)

那么【不可重复读】是问题吗???【不可重复读】问题指的是在同一个事务中多次读取相同的数据时,数据的值发生了变化。

它会导致事务在同一逻辑流程中看到不同的结果,进而导致数据的不一致。例如:

  • 事务 A 读取某条记录的余额为 100。
  • 事务 B 在事务 A 再次读取时修改了余额为 200,并提交。
  • 事务 A 再次读取时看到余额变成 200,导致事务 A 原本的逻辑失效,造成了数据不一致。

这种数据的不一致性可能导致应用程序逻辑出错,特别是在财务、库存、订单等场景中,可能引发严重的问题。

7.6 可重复读【Repeatable Read】

先在 A、B客户端设置全局隔离级别 RR,然后重启客户端,保证局部隔离级别也为 RR

sql 复制代码
set global transaction isolation level repeatable read;

结果如下:

然后 A、B 客户端同步的开启事务:

然后在客户端 A 中进行【修改】和【插入】一条记录,并提交:

但是当我们在客户端 B 中进行 select 读取记录时,是看不到客户端 A 进行【更新】和【插入】的新纪录的:

当我们在客户端 B 中,对当前的事务进行 commit 以后,就能看到新的记录了:

换句话说,在 RR 模式下,能保证两个事务并发运行的过程中,一个事务进行【插入 / 修改】记录,并不会影响另外一个事务的【读取】,这叫做【可重复读】。

同样的,当我们在客户端 A 中进行【删除】记录时,一样不会影响客户端 B 的【读取】:

当我们 commit 掉客户端 B 的事务以后,就能看到结果了:

经过多次实验,发现客户端 A 在对应事务中进行【insert / delete / update】数据的时候,在客户端 B 的事务周期中,也没有什么影响,也符合【可重复读】的特点。

但是,一般的数据库在【可重复读】情况的时候,无法屏蔽其他事务 insert 的数据。为什么?

  • 因为隔离性实现是对数据加锁完成的,而 insert 待插入的数据因为并不存在,那么一般加锁无法屏蔽这类问题,会造成虽然大部分内容是可重复读的;
  • 但是 insert 的数据在【可重复读】的情况下被读取出来,导致多次查找时,会多查找出来新的记录,就如同产生了幻觉。这种现象,叫做 幻读(phantom read)
  • 很明显,MySQL(当前使用的 5.7 版本) 在 RR 级别的时候,是解决了幻读问题的(解决的方式是用 Next-Key 锁(GAP+行锁)解决的)。
  • 具体来说,当事务执行查询时,它会对所查询的数据行加上行锁,并且如果查询条件中存在范围条件(例如,BETWEEN>, < 等),则 MySQL 会对该范围的 "间隙" 加上锁,这样其他事务就不能插入符合条件的行,从而避免了幻读。

幻读是专门针对于【insert】这个行为诞生的概念,所谓幻读就是:

  • RRRCRU 级别下,对于插入问题,我们在一个事务中进行【读取】的时候,可能会看到另外一个事务【新插入】且【已经提交】的结果。

那么为什么 MySQL 要用 RR 作为默认隔离级别呢?

  • 因为 RR 的隔离性做的非常好,也就是说,它可以有效的去隔离两个事务在【读 / 写】并发的场景中,一个事务在进行【写】操作时,另外一个事务可以并发的去【读】;
  • 而且因为隔离问题,两个事务不会互相夯住(本质是指不存在事务死锁),此时就会提高并发效率。

7.7 串行化【serializable】

注意:是将所有的【事务】给串行化,而不是把 SQL 语句给串行化,也就是说,只有一个事务 commit 了以后,另外一个事务才能继续跑。

先在 A、B客户端设置全局隔离级别 串行化 ,然后重启客户端,保证局部隔离级别也为 串行化

sql 复制代码
set global transaction isolation level serializable;

结果如下:

然后 A、B 客户端同步的开启事务,可以看到两个事务进行【读取】操作时,不会串行化,它们是共享锁的:

此时,我们在客户端 A 中进行【删除】一条记录的操作时,会阻塞,如下所示:

那么只有客户端 B 事务提交以后,客户端 A 才能进行【删除】操作:

故,当 A、B 客户端都以【串行化】的方式去运行的时候,那么 select 操作会持有 去访问 account 表进行读取数据;但是,当你在某个客户端的事务中进行【insert / delete / update】操作时,这些操作会被放进 MySQL 的【等待队列】中,只有当【读取】的事务 commit 结束了,那么【等待队列】中的事务操作才会被执行。

如下图所示:

总结:

  • 其中隔离级别越严格,安全性越高,但数据库的并发性能也就越低,往往需要在两者之间找一个平衡点;
  • 【不可重复读】的重点是【修改】和【删除】:同样的条件,你读取过的数据,再次读取出来发现值不一样了;
  • 【幻读】的重点在于【新增】: 同样的条件,第 1 次和第 2 次读出来的记录数不一样;
  • MySQL 默认的隔离级别是【可重复读】,一般情况下不要修改,上面的例子可以看出,事务也有长短事务这样的概念。
  • 事务间互相影响,指的是事务在【并行】执行的时候,即都没有 commit 的时候,影响会比较大。

如下图所示:

7.8 一致性(Consistency)

事务执行的结果,必须使数据库从一个一致性状态,变到另一个一致性状态。

  • 当数据库只包含事务成功提交的结果时,数据库处于一致性状态;
  • 如果系统运行发生中断,某个事务尚未完成而被迫中断,而改未完成的事务对数据库所做的修改已被写入数据库,此时数据库就处于一种不正确(不一致)的状态。

因此一致性是通过原子性来保证的。其实一致性和用户的业务逻辑强相关,一般 MySQL 提供技术支持,但是一致性还是要用户业务逻辑做支撑,也就是,一致性,是由用户决定的。

从技术观点上来看:

  • 原子性、持久性、隔离性这三大属性最终都是围绕着,保证数据库【一致性】来展开的,故而要通过 AID 来保证 C

从用户观点上来看:

  • 用户希望系统在处理数据时 无误 ,即使在出现故障或并发情况下,也能保证数据的一致性,不丢失、不冲突。这些技术属性(原子性、持久性、隔离性)最终为用户提供了一个稳定可靠 的数据库环境。

8. 多版本并发控制(MVCC)

数据库并发的场景有三种:

  • 读 - 读:不存在任何问题,也不需要并发控制。
  • 读 - 写:有线程安全问题,可能会造成事务隔离性问题,可能遇到脏读,幻读,不可重复读。
  • 写 - 写:有线程安全问题,可能会存在更新丢失问题,比如第一类更新丢失,第二类更新丢失。

8.1 读 - 写

多版本并发控制(MVCC)是一种用来解决【读 - 写】冲突的无锁并发控制。

为事务分配单向增长的 事务ID,为每个修改保存一个版本,版本与 事务ID 关联,读操作只读该事务开始前的数据库的快照。

所以 MVCC 可以为数据库解决以下问题:

  • 在并发读写数据库时,可以做到在读操作时不用阻塞写操作,写操作也不用阻塞读操作,提高了数据库并发读写的性能;
  • 同时还可以解决脏读,幻读,不可重复读等事务隔离问题,但不能解决更新丢失问题。

理解 MVCC 需要知道三个前提知识:

  • 3 个记录隐藏字段;
  • undo 日志;
  • Read View

8.2 三个记录隐藏字段

  • DB_TRX_ID:6 byte,最近修改(修改 / 插入)事务 ID,记录创建这条记录 / 最后一次修改该记录的事务 ID;
  • DB_ROLL_PTR:7 byte,回滚指针,指向这条记录的上一个版本(简单理解成,指向历史版本就行,这些数据一般在 undo log 中);
  • DB_ROW_ID:6 byte,隐含的自增 ID(隐藏主键),如果数据表没有主键,InnoDB 会自动以 DB_ROW_ID 产生一个聚簇索引;
  • 补充:实际还有一个删除 flag 隐藏字段,既记录被更新或删除并不代表真的删除,而是删除 flag 变了;

假设测试表结构如下:

sql 复制代码
# 建表
mysql> create table if not exists student(
       name varchar(11) not null, 
       age int not null
       );

# 插入一条记录
mysql> insert into student (name, age) values ('张三', 28);
Query OK, 1 row affected (0.05 sec)

# 查看表的内容
mysql> select * from student;
+--------+-----+
| name   | age |
+--------+-----+
| 张三   |  28 |
+--------+-----+
1 row in set (0.00 sec)

上面描述的意思是:

name age DB_TRX_ID(创建该记录的事务ID) DB_ROW_ID(隐式主键) DB_ROLL_PTR(回滚指针)
张三 28 null 1 null

我们目前并不知道创建该记录的事务 ID、隐式主键,我们就默认设置成 null 和 1,另外,第一条记录也没有其他

版本,我们设置回滚指针为 null。

8.3 undo 日志

MySQL 是以服务进程的方式,在内存中运行的。

我们之前所讲的所有机制:索引,事务,隔离性,日志等,都是在内存中完成的,即在 MySQL 内部的相关缓冲区 buffer pool 中,保存相关数据,完成各种判断操作。然后在合适的时候,将相关数据刷新到磁盘当中的。

所以,我们这里可以把 undo log 简单理解成 MySQL 中的一段内存缓冲区,用来保存日志数据的就行。

8.4 模拟 MVCC

假设现在有一个事务 10(仅仅为了好区分),对 student 表中记录进行修改(update)操作:将 name(张三)改成

name(李四)。

  • 事务 10,因为要修改,所以要先给该记录加 行锁
  • 修改前,现将改行记录拷贝到 undo log 中,所以 undo log 中就有了一行副本数据。(原理就是写时拷贝)
  • 所以现在 MySQL 中有两行同样的记录。现在修改原始记录中的 name 改成 "李四"。并且修改原始记录的隐藏字段 DB_TRX_ID 为当前事务 10 的 ID(我们默认从 10 开始,之后递增)。而原始记录的回滚指针 DB_ROLL_PTR 列,里面写入 undo log 中副本数据的地址,从而指向副本记录,表示我的上一个版本就是它。
  • 事务 10 提交,释放锁。

如下图所示:

此时,最新的记录是 "李四" 那条记录。

现在又有一个事务 11,对 student 表中记录进行修改(update)操作:将 age(28)改成 age(38)。

  • 事务 11,因为也要修改,所以要先给该记录加 行锁
  • 修改前,现将改行记录拷贝到 undo log 中,所以,undo log 中就又有了一行副本数据。此时,新的副本,我们采用头插方式,插入 undo log 中。
  • 现在修改原始记录中的 age 改成 38。并且修改原始记录的隐藏字段 DB_TRX_ID 为当前事务 11 的 ID。而原始记录的回滚指针 DB_ROLL_PTR 列,里面写入 undo log 中副本数据的地址,从而指向副本记录,既表示我的上一个版本就是它。
  • 事务 11 提交,释放锁。

如下图所示:

这样,我们就有了一个基于链表记录的历史版本链。所谓的回滚,无非就是用历史数据,覆盖当前数据。

而像 undo log 中的一个一个版本,我们可以称之为一个一个的 快照

9. 总结

下面是我个人对 InnoDB 隔离性的统一理解。

9.1 为什么不同事务可以对同一条记录读写并发?

因为 InnoDB 使用 MVCC 维护了数据的多个历史版本。

  • INSERT / UPDATE / DELETE 操作的是 当前版本数据
  • 【普通 SELECT】 采用 快照读,读取的是 符合 Read View 的历史版本

由于两个事务在访问时,实际读取的是不同版本的数据,而不是同一条物理记录,因此在不需要加锁的情况下也可以并发执行,从而显著提升系统性能。

9.2 为什么 A 事务已提交,但 B 事务仍然读不到最新数据?

因为 B 事务的快照读受其 Read View 约束。

  • B 事务创建 Read View 后,只能看到在该 Read View 创建之前已经提交的版本;
  • A 事务提交生成的新版本,不满足 B 事务 Read View 的可见性规则;
  • 历史版本本身不会被修改。

因此,B 事务始终读取历史版本数据,从结果上体现为事务之间的隔离性。

9.3 RC 和 RR 隔离级别下,能否看到其他事务的提交,本质区别是什么?

关键在于 是否重新生成 Read View:

  • RC(Read Committed):每一次快照读都会重新创建 Read View,因此可能读到其他事务已提交的新数据,表现为【不可重复读】;
  • RR(Repeatable Read):在事务中第一次快照读时创建 Read View,后续读操作复用该 Read View,因此读到的数据始终一致,实现【可重复读】;

9.4 为什么事务可以回滚(rollback)?

因为 InnoDB 在修改数据时,会通过 undo log 记录历史版本信息。

当事务需要回滚时:

  • 根据 undo log 将数据恢复到事务开始前的状态;
  • 释放事务相关的资源,包括事务结构体、Read View 以及所持有的锁;

整个回滚过程在加锁保护下完成,从而保证数据恢复的正确性和一致性。

相关推荐
计算机毕设指导62 小时前
基于Django的本地健康宝微信小程序系统【源码文末联系】
java·后端·python·mysql·微信小程序·小程序·django
l1t2 小时前
DeepSeek对利用DuckDB求解Advent of Code 2021第9题“烟雾盆地”第二部分SQL的分析
数据库·人工智能·sql·递归·duckdb·deepseek·cte
gjc5922 小时前
MySQL无主键大表删除导致主从同步延迟的深度分析
数据库·mysql
汪不止2 小时前
【 分布式唯一业务单号生成方案:Redis + 数据库双保险架构】
数据库·redis·分布式
典孝赢麻崩乐急2 小时前
Redis复习-------Redis事务
数据库·redis·缓存
Gofarlic_OMS2 小时前
通过MathWorks API实现许可证管理自动化
大数据·数据库·人工智能·adobe·金融·自动化·区块链
橘子真甜~2 小时前
Reids命令原理与应用3 - Redis 主线程,辅助线程与存储原理
网络·数据库·redis·缓存·线程·数据类型·存储结构
杨了个杨89822 小时前
Rsyslog + MySQL 实现日志集中存储
数据库·mysql
程序猿20232 小时前
SQL-性能优化
数据库·sql·性能优化