Mysql中事务的读一致性问题,以及如何用MVCC解决

事务四大特性的实现:

原子性事务具有回滚的能力,InnoDB引擎使用undo log日志表来进行回滚操作。

持久性InnoDB引擎使用redo log日志表来保证数据的持久性。

事务的隔离性产生的问题:

**脏读:**一个事务读取到了另一个事务未提交的数据。

**不可重复读:**一个事务读取到了另一个事务已提交的数据,在同一个事务内,不管进行多少次查询,查询到的结果都是相同的。

**虚读(幻读):**一个事务读取了另一个事务提交的新增数据。

事务并发的三大问题其实都是数据库读一致性问题,必须由数据库提供一定的事务隔离机制来解决。

mysql数据库的隔离级别:

Read Uncommitted (读未提交),未解决任何并发问题,事务未提交的数据对其他事务也是可见的,会出现脏读。

Read Committed (已提交读),解决脏读问题,一个事务开始之后,只能看到已提交的事务所做的修改,会出现不可重复读。

Repeatable Read (可重复读),解决不可重复读问题,在同一个事务中多次读取同样的数据结果是一样的,这种隔离级别未定义解决幻读的问题。

Serializable (串行化),解决所有问题,最高的隔离级别,通过强制事务的串行执行。

InnoDB对事务隔离级别的支持程度:

|-----------------------------|-----|-------|------------|
| 事务隔离级别 | 脏读 | 不可重复读 | 幻读 |
| Read Uncommitted (读未提交) | 可能 | 可能 | 可能 |
| Read Committed (已提交读) | 不可能 | 可能 | 可能 |
| Repeatable Read (可重复读) | 不可能 | 不可能 | 对InnoDB不可能 |
| Serializable (串行化) | 不可能 | 不可能 | 不可能 |

**思考:**如果要解决读一致性的问题,保证一个事务中前后两次读取数据结果一致,实现事务隔离,应该怎么做?

**第一种解决方式:**在读取数据前,对其加锁,阻止其他事务对数据进行修改

(LBCC) Lock BasedConcurrency Control

**第二种解决方式:**生成一个数据请求时间点的一致性数据快照(Snapshot),并用这个快照来提供一定级别(语句级或事务级)的一致性读取

(MVCC) Multi VersionConcurrency Control。MVCC只在RC RR中使用。

MVCC解决读一致性问题原理:

测试使用的环境:mysql数据,采用引擎InnoDB,采用隔离级别Repeatable Read (可重复读)。

MVCC的概念:

(MVCC) Multi VersionConcurrency Control。MVCC只在ReadCommitted (已提交读)和Repeatable Read (可重复读)中使用。

MVCC 是一种并发控制的方法,一般在数据库管理系统中,实现对数据库的并发访问;在编程语言中实现事务内存。

一句话讲,MVCC就是用 同一份数据临时保留多版本的方式 的方式,实现并发控制。

Mysql会在表中添加2个隐藏的字段,DB_TRX_ID(插入或者更新行的最后一个事务的ID) 和 DB_ROLL_PTR (回滚指针)。每开始新的事务,系统版本号都会自动递增。事务开始时刻的系统版本号会作为事务的版本号,用来和查询每行记录的版本号进行比较。回滚指针用来查找历史版本的数据。

准备环境 | MVCC效果演示:

创建表结构,添加数据

sql 复制代码
CREATE TABLE `t_mvcc` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(20) DEFAULT NULL,
  PRIMARY KEY (`id`)) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;

添加数据后如下:

创建测试表,用来生成事务ID的作用:

sql 复制代码
CREATE TABLE `t_mvcc_demo`(
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(20) DEFAULT NULL,
  PRIMARY KEY (`id`)) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;

数据如下:

MVCC 识别规则

当执行查询sq|时会生成一致性视图read-view,它由执行查询时所有未提交事务id数组(数组里最小的id为min id)和已创建的最大事务id (max id)组成,查询的数据结果需要跟read-view做比对从而得到快照结果。

版本链比对规则:

1.如果落在绿色部分( trx jid<min. id),表示这个版本是已提交的事务生成的,这个数据是可见的;

2.如果落在红色部分( trx id>max. id),表示这个版本是由将来启动的事务生成的,是肯定不可见的;

3.如果落在黄色部分(min. id <=tnx id<=max_ id),那就包括两种情况

a.若row的trx_ id在数组中,表示这个版本是由还没提交的事务生成的,可见,当前自己的事务是可见的;

b.若row的trx. id不在数组中,表示这个版本是已经提交了的事务生成的,可见。

图解

相关推荐
林的快手44 分钟前
209.长度最小的子数组
java·数据结构·数据库·python·算法·leetcode
HEU_firejef1 小时前
Redis——缓存预热+缓存雪崩+缓存击穿+缓存穿透
数据库·redis·缓存
KELLENSHAW2 小时前
MySQL45讲 第三十七讲 什么时候会使用内部临时表?——阅读总结
数据库·mysql
四七伵2 小时前
MySQL外键类型与应用场景总结:优缺点一目了然
mysql
SelectDB2 小时前
飞轮科技荣获中国电信星海大数据最佳合作伙伴奖!
大数据·数据库·数据分析
core5123 小时前
flink cdc各种数据库 jar下载地址
mysql·oracle·flink·jar·oceanbase·cdc
小刘鸭!3 小时前
Hbase的特点、特性
大数据·数据库·hbase
凡人的AI工具箱3 小时前
每天40分玩转Django:Django表单集
开发语言·数据库·后端·python·缓存·django
奔跑草-3 小时前
【数据库】SQL应该如何针对数据倾斜问题进行优化
数据库·后端·sql·ubuntu
Elastic 中国社区官方博客3 小时前
如何通过 Kafka 将数据导入 Elasticsearch
大数据·数据库·分布式·elasticsearch·搜索引擎·kafka·全文检索