一、事务的基本概念
(一)什么是事务
事务是一个逻辑工作单元,由一组数据库操作组成。这些操作要么全部成功执行,要么全部回滚,以确保数据库的一致性。事务具有以下四个特性,通常被称为 ACID 特性:
- 原子性(Atomicity):事务中的所有操作要么全部成功,要么全部失败回滚,就像一个不可分割的原子。
- 一致性(Consistency):事务必须使数据库从一个一致性状态转变为另一个一致性状态。
- 隔离性(Isolation):多个事务并发执行时,它们之间应该相互隔离,不能相互干扰。
- 持久性(Durability):一旦事务提交,它对数据库的修改就应该是永久性的,即使系统发生故障也不会丢失。
(二)为什么需要事务隔离级别
在多个事务并发执行的情况下,如果没有适当的隔离机制,可能会出现各种数据不一致的问题。事务隔离级别就是为了控制事务之间的干扰程度,确保数据的一致性和正确性。
二、MySQL 的事务隔离级别
MySQL 提供了四种事务隔离级别,分别是读未提交(Read Uncommitted)、读已提交(Read Committed)、可重复读(Repeatable Read)和串行化(Serializable)。
(一)读未提交(Read Uncommitted)
- 定义:在这个隔离级别下,一个事务可以读取另一个未提交事务的数据。这意味着一个事务可以看到其他事务尚未提交的中间结果。
- 存在的问题 :
- 脏读(Dirty Read):一个事务读取到了另一个事务尚未提交的数据,如果另一个事务回滚,那么这个读取到的数据就是错误的。
- 示例 :
- 事务 A 开始更新一条记录,但尚未提交。
- 事务 B 读取了这条被事务 A 更新但未提交的记录。
- 事务 A 回滚了更新操作。
- 此时,事务 B 读取到的数据是错误的,因为它读取了一个被回滚的事务的数据。
(二)读已提交(Read Committed)
- 定义:在这个隔离级别下,一个事务只能读取另一个已提交事务的数据。这可以避免脏读问题,但可能会出现不可重复读问题。
- 存在的问题 :
- 不可重复读(Non-repeatable Read):一个事务在多次读取同一数据时,可能会得到不同的结果,因为在这个事务执行过程中,其他事务可能对该数据进行了修改并提交。
- 示例 :
- 事务 A 读取一条记录。
- 事务 B 更新了这条记录并提交。
- 事务 A 再次读取这条记录,发现结果与第一次不同。
(三)可重复读(Repeatable Read)
- 定义:这是 MySQL 的默认隔离级别。在这个隔离级别下,一个事务在多次读取同一数据时,会得到相同的结果,避免了不可重复读问题。但可能会出现幻读问题。
- 存在的问题 :
- 幻读(Phantom Read):一个事务在多次执行相同的查询时,可能会得到不同数量的行,因为在这个事务执行过程中,其他事务可能插入了新的行。
- 示例 :
- 事务 A 读取满足某个条件的所有记录。
- 事务 B 插入了一条满足事务 A 查询条件的新记录并提交。
- 事务 A 再次执行相同的查询,发现结果比第一次多了一行。
(四)串行化(Serializable)
- 定义:在这个隔离级别下,事务之间是完全串行执行的,一个事务在执行时会锁定它所访问的所有数据,直到事务提交。这可以避免脏读、不可重复读和幻读问题,但会极大地降低数据库的并发性能。
- 存在的问题 :
- 并发性能非常低,因为事务之间需要排队执行。
- 示例 :
- 事务 A 开始执行,锁定了它需要访问的所有数据。
- 事务 B 尝试访问被事务 A 锁定的数据,必须等待事务 A 提交后才能执行。
三、如何设置事务隔离级别
在 MySQL 中,可以通过以下方式设置事务隔离级别:
(一)使用 SQL 语句
-
设置全局事务隔离级别:
SET GLOBAL TRANSACTION ISOLATION LEVEL <隔离级别名称>;
例如,要将全局事务隔离级别设置为读已提交,可以使用以下命令:
SET GLOBAL TRANSACTION ISOLATION LEVEL READ COMMITTED;
-
设置当前会话的事务隔离级别:
SET SESSION TRANSACTION ISOLATION LEVEL <隔离级别名称>;
例如,要将当前会话的事务隔离级别设置为可重复读,可以使用以下命令:
SET SESSION TRANSACTION ISOLATION LEVEL REPEATABLE READ;
(二)在配置文件中设置
可以在 MySQL 的配置文件(通常是 my.cnf 或 my.ini)中设置默认的事务隔离级别。在 [mysqld] 部分添加以下行:
transaction-isolation = <隔离级别名称>
例如,要将默认的事务隔离级别设置为串行化,可以添加以下行:
transaction-isolation = SERIALIZABLE
四、事务隔离级别对并发性能的影响
不同的事务隔离级别对数据库的并发性能有不同的影响:
(一)读未提交
- 优点:允许最大的并发度,因为事务之间的干扰最小。
- 缺点:会导致脏读问题,数据的一致性无法得到保证。
(二)读已提交
- 优点:避免了脏读问题,比读未提交隔离级别更能保证数据的一致性。
- 缺点:可能会出现不可重复读问题,并发性能比读未提交隔离级别稍低。
(三)可重复读
- 优点:避免了不可重复读问题,是 MySQL 的默认隔离级别,在大多数情况下能够满足数据一致性的要求。
- 缺点:可能会出现幻读问题,并发性能比读已提交隔离级别更低。
(四)串行化
- 优点:可以完全避免脏读、不可重复读和幻读问题,保证了数据的绝对一致性。
- 缺点:并发性能非常低,只适用于对数据一致性要求非常高且并发度很低的场景。
五、如何选择合适的事务隔离级别
在选择事务隔离级别时,需要考虑以下几个因素:
(一)数据一致性要求
- 如果对数据一致性要求非常高,不能容忍任何数据不一致的情况,可以选择串行化隔离级别。
- 如果需要保证数据不被脏读,但可以接受不可重复读或幻读问题,可以选择读已提交隔离级别。
- 如果需要避免不可重复读问题,可以选择可重复读隔离级别。
- 如果对数据一致性要求不高,可以选择读未提交隔离级别以提高并发性能。
(二)并发性能要求
- 如果应用对并发性能要求很高,可以选择较低的隔离级别,如读未提交或读已提交。
- 如果并发性能要求不是很高,但需要保证一定的数据一致性,可以选择可重复读隔离级别。
- 如果并发性能要求非常低,且对数据一致性要求极高,可以选择串行化隔离级别。
(三)应用场景
- 对于一些对数据一致性要求不高的应用,如日志记录系统,可以选择读未提交隔离级别。
- 对于一些需要保证数据不被脏读,但对不可重复读问题可以容忍的应用,如在线购物系统的库存查询,可以选择读已提交隔离级别。
- 对于一些需要保证数据在多次读取时一致的应用,如银行系统的账户余额查询,可以选择可重复读隔离级别。
- 对于一些对数据一致性要求极高且并发度很低的应用,如金融交易系统的核心业务处理,可以选择串行化隔离级别。