Mysql中事务的读一致性问题，以及如何用MVCC解决

事务四大特性的实现：

原子性事务具有回滚的能力，InnoDB引擎使用undo log日志表来进行回滚操作。

持久性InnoDB引擎使用redo log日志表来保证数据的持久性。

事务的隔离性产生的问题：

**脏读：**一个事务读取到了另一个事务未提交的数据。

**不可重复读：**一个事务读取到了另一个事务已提交的数据，在同一个事务内，不管进行多少次查询，查询到的结果都是相同的。

**虚读（幻读）：**一个事务读取了另一个事务提交的新增数据。

事务并发的三大问题其实都是数据库读一致性问题，必须由数据库提供一定的事务隔离机制来解决。

mysql数据库的隔离级别：

Read Uncommitted (读未提交)，未解决任何并发问题，事务未提交的数据对其他事务也是可见的，会出现脏读。

Read Committed (已提交读)，解决脏读问题，一个事务开始之后，只能看到已提交的事务所做的修改，会出现不可重复读。

Repeatable Read (可重复读)，解决不可重复读问题，在同一个事务中多次读取同样的数据结果是一样的，这种隔离级别未定义解决幻读的问题。

Serializable (串行化)，解决所有问题，最高的隔离级别，通过强制事务的串行执行。

InnoDB对事务隔离级别的支持程度：

|-----------------------------|-----|-------|------------|
| 事务隔离级别 | 脏读 | 不可重复读 | 幻读 |
| Read Uncommitted (读未提交) | 可能 | 可能 | 可能 |
| Read Committed (已提交读) | 不可能 | 可能 | 可能 |
| Repeatable Read (可重复读) | 不可能 | 不可能 | 对InnoDB不可能 |
| Serializable (串行化) | 不可能 | 不可能 | 不可能 |

**思考：**如果要解决读一致性的问题，保证一个事务中前后两次读取数据结果一致，实现事务隔离，应该怎么做?

**第一种解决方式：**在读取数据前，对其加锁，阻止其他事务对数据进行修改

(LBCC) Lock BasedConcurrency Control

**第二种解决方式：**生成一个数据请求时间点的一致性数据快照(Snapshot),并用这个快照来提供一定级别(语句级或事务级)的一致性读取

(MVCC) Multi VersionConcurrency Control。MVCC只在RC RR中使用。

MVCC解决读一致性问题原理：

测试使用的环境：mysql数据，采用引擎InnoDB，采用隔离级别Repeatable Read (可重复读)。

MVCC的概念：

(MVCC) Multi VersionConcurrency Control。MVCC只在ReadCommitted (已提交读)和Repeatable Read (可重复读)中使用。

MVCC 是一种并发控制的方法，一般在数据库管理系统中，实现对数据库的并发访问；在编程语言中实现事务内存。

一句话讲，MVCC就是用同一份数据临时保留多版本的方式的方式，实现并发控制。

Mysql会在表中添加2个隐藏的字段，DB_TRX_ID（插入或者更新行的最后一个事务的ID）和 DB_ROLL_PTR （回滚指针）。每开始新的事务，系统版本号都会自动递增。事务开始时刻的系统版本号会作为事务的版本号，用来和查询每行记录的版本号进行比较。回滚指针用来查找历史版本的数据。

准备环境 | MVCC效果演示：

创建表结构，添加数据

sql 复制代码

CREATE TABLE `t_mvcc` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(20) DEFAULT NULL,
  PRIMARY KEY (`id`)) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;

添加数据后如下：

创建测试表，用来生成事务ID的作用：

sql 复制代码

CREATE TABLE `t_mvcc_demo`(
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(20) DEFAULT NULL,
  PRIMARY KEY (`id`)) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;

数据如下：

MVCC 识别规则

当执行查询sq|时会生成一致性视图read-view,它由执行查询时所有未提交事务id数组(数组里最小的id为min id)和已创建的最大事务id (max id)组成，查询的数据结果需要跟read-view做比对从而得到快照结果。

版本链比对规则:

1.如果落在绿色部分( trx jid<min. id),表示这个版本是已提交的事务生成的，这个数据是可见的;

2.如果落在红色部分( trx id>max. id),表示这个版本是由将来启动的事务生成的，是肯定不可见的;

3.如果落在黄色部分(min. id <=tnx id<=max_ id),那就包括两种情况

a.若row的trx_ id在数组中,表示这个版本是由还没提交的事务生成的，可见,当前自己的事务是可见的;

b.若row的trx. id不在数组中，表示这个版本是已经提交了的事务生成的，可见。

图解