MySQL事务篇1:事物的四大特性(ACID)、三类数据读取问题与隔离级别

一、什么是事务?

MySQL的事务(Transaction)是一组由数据库管理系统(DBMS) 执行的一个或多个SQL语句 的集合,这些SQL语句作为一个单独的工作单元执行。事务的主要目的是确保数据库的一致性和完整性 ,特别是在并发环境下。这些操作要么全部都执行,要么都不执行, 它是一个不可分割的工作执行单元。

二、事务的特性

事务是由**[MySQL 的引擎]** 来实现的,我们常见的 InnoDB 引擎它是支持事务的。不过并不是所有的引擎都能支持事务,比如 MySQL 原生的 MyISAM 引擎就不支持事务,也正是这样,所以大多数 MySQL 的引擎都是用 InnoDB。

事务有四个关键特性,通常被称为ACID特性。这四个特性是:

1、原子性(Atomicity):

事务中的所有操作要么全部成功,要么全部失败。 即事务是一个不可分割的工作单元。即使在事务执行过程中发生了错误,事务中的任何更改都不会保留,系统会回滚(Undo)所有已经执行的操作,使数据库回到事务开始之前的状态。
2、一致性(Consistency)

事务从一个一致的数据库状态转换到另一个一致的数据库状态。数据库在事务开始之前和结束之后都必须满足所有的定义的约束、触发器和规则。换句话说,事务开始前和事务结束后数据应该是一致的,例如张三有300,李四有400,那么无论他们如何转账,总钱数700应该是不变的
3、隔离性(Isolation)

事务的执行过程对其他事务是隔离的。**即使多个事务并发执行,每个事务也无法看到其他事务未提交的中间状态,即多个并发事务直接要相互隔离,互不干扰。**隔离性保证了并发事务的正确执行。MySQL提供了不同的隔离级别来控制事务之间的隔离程度,包括未提交读、提已交读、可重复读和可序列化。
4、持久性(Durability)

一旦事务提交,所做的更改将永久保存到数据库中,即使发生系统故障,数据也不会丢失。持久性通过将事务的日志记录到持久存储设备(如磁盘)上来实现。提交事务后,系统保证即使系统崩溃,也能通过日志恢复已提交的数据。

InnoDB 引擎通过什么技术来保证事务的这四个特性的呢?

  • 持久性是通过 redo log (重做日志)来保证的;
  • 原子性是通过 undo log(回滚日志) 来保证的;
  • 隔离性是通过 MVCC(多版本并发控制)或锁机制来保证的;
  • 一致性则是通过持久性+原子性+隔离性来保证;

简单知道一下即可,这是一个非常复杂的底层逻辑。

三、并发事务下三类数据读取问题与数据更新

MySQL 服务端是允许多个客户端连接的,这意味着 MySQL 会出现同时处理多个事务的情况。主要有三类数据读取问题:

1、脏读(Dirty Read):

一个事务能够读取另一个事务尚未提交的数据。 这种情况会导致读取的数据可能在未来被回滚,从而导致读取到不正确的数据。
**示例:**事务A更新了某行数据,然后事务B读取了这些更新的数据。然而,事务A随后回滚了,这意味着事务B读到了未提交的、随后被撤销的数据。

2、不可重复读(Non-Repeatable Read):

一个事务在读取某行数据后,再次读取该行数据时,发现数据已经被另一个已提交的事务修改了两次读取同一数据的结果不一致

示例:事务A在某时刻读取了一行数据。然后事务B更新了这行数据并提交。事务A再次读取该行数据时,发现数据已经改变。

3、幻读(Phantom Read):

一个事务按照条件查询数据时,没有对应的数据行,但是在插入数据时,又发现这行数据已经存在,好像出现了"幻影"。

示例:事务A读取了满足某个条件的所有数据行。事务B插入了一些满足这个条件的新数据行并提交。事务A再次读取时,发现多了一些之前没有的数据行。

我们对三类数据读取问题做一个总结就是:

脏读:读到其他事务未提交的数据;

不可重复读:前后读取的数据不一致;

幻读:前后读取的记录数量不一致。

在并发事务下,不仅会遇到数据读取问题,还会遇到数据更新问题,主要有以下两类:

丢失更新(Lost Update)

两个事务都读取同一数据并修改它们中的一个,**导致一个事务的修改被另一个事务的修改覆盖,最终的更新丢失。**这种情况通常发生在没有合适的锁机制来同步并发事务时。

示例:事务A和事务B都读取了同一行数据,然后事务A和事务B都修改了这行数据并提交。事务A的修改被事务B的修改覆盖,导致事务A的更新丢失。

不可重复写(Non-Repeatable Write)

一个事务在写入某行数据后,另一个事务修改了这行数据。当第一个事务再次写入这行数据时,发现数据已经被另一个事务改变了。这种情况导致数据的不一致性。

示例:事务A和事务B同时读取同一行数据。事务A先修改了数据并提交,事务B再修改数据并提交,事务A的更改可能没有被考虑在内。

四、事务隔离级别

前面我们提到,当多个事务并发执行时可能会遇到【脏读、不可重复读、幻读 】的现象,这些现象会对事务的一致性产生不同程序的影响。SQL 标准提出了四种隔离级别来规避这些现象,隔离级别越高,性能效率就越低,这四个隔离级别如下:

  • **读未提交:**指一个事务还没提交时,它做的变更就能被其他事务看到。
  • **读提交:**指一个事务提交之后,它做的变更才能被其他事务看到。
  • 可重复读: 指一个事务执行过程中看到的数据,一直跟这个事务启动时看到的数据是一致的,MySQL InnoDB 引擎的默认隔离级别。
  • **串行化:**会对记录加上读写锁,在多个事务对这条记录进行读写操作时,如果发生了读写冲突的时候,后访问的事务必须等前一个事务执行完成,才能继续执行。

不同的数据库厂商对 SQL 标准中规定的 4 种隔离级别的支持不一样,有的数据库只实现了其中几种隔离级别,MySQL 虽然支持 4 种隔离级别,但是与SQL 标准中规定的各级隔离级别允许发生的现象却有些出入。(隔离级别的定义由SQL提出,这不是MySQL规定的)

MySQL InnoDB 引擎在可重复读隔离级别下,可以很大程度上避免幻读现象的发生,所以 MySQL 并不会使用串行化隔离级别来避免幻读现象的发生,因为使用串行化隔离级别会严重影响性能(毕竟是悲观锁)。而关于为什么可以很大程度上避免幻读现象的发生,这就是涉及到了一个概念叫做MVCC。

多版本并发控制(MVCC,Multi-Version Concurrency Control)是一种用于提高数据库系统并发性能的技术。**它允许多个事务在不加锁的情况下并发读取和写入数据,从而避免了许多锁竞争问题。MVCC通过保存数据的多个版本来实现一致性和隔离性。**关于更多MVCC的东西可以看我的另一篇文章。

相关推荐
时差95319 分钟前
【面试题】Hive 查询:如何查找用户连续三天登录的记录
大数据·数据库·hive·sql·面试·database
让学习成为一种生活方式20 分钟前
R包下载太慢安装中止的解决策略-R语言003
java·数据库·r语言
秋意钟1 小时前
MySQL日期类型选择建议
数据库·mysql
Dxy12393102162 小时前
python下载pdf
数据库·python·pdf
ac-er88882 小时前
MySQL如何实现PHP输入安全
mysql·安全·php
桀桀桀桀桀桀2 小时前
数据库中的用户管理和权限管理
数据库·mysql
superman超哥3 小时前
04 深入 Oracle 并发世界:MVCC、锁、闩锁、事务隔离与并发性能优化的探索
数据库·oracle·性能优化·dba
用户8007165452003 小时前
HTAP数据库国产化改造技术可行性方案分析
数据库
engchina4 小时前
Neo4j 和 Python 初学者指南:如何使用可选关系匹配优化 Cypher 查询
数据库·python·neo4j
engchina4 小时前
使用 Cypher 查询语言在 Neo4j 中查找最短路径
数据库·neo4j