记录一次从库并行回放出现死锁的问题

目录

问题描述

环境信息

问题分析

1、从库状态检查

2、检查从库ERROR日志

解决方案

临时解决方案:

长久解决方案:

问题描述:

晚上20:00以后,收到一个TDSQL-MySQL实例所有从库延迟超过900秒告警。

环境信息:

TDSQL-MySQL版本-10.2.3

实例类型-集中式

DB内核版本-8.0.24

问题分析:

1、从库状态检查

a)登录3台从库,执行show slave status \G,检查从库seconds_behind_master,延迟确实在逐渐增加。

b)查询从库回放线程状态,执行select * from perofrmance_schema.replication_applier_status_by_worker limit 10 \G,查看参数信息APPLYING_TRANSACTION_LAST_TRANSIENT_ERROR_MESSAGE提示Deadlock found when trying to get lock;try restarting transaction

2、检查从库ERROR日志

检查从库error日志,在error日志中找到了对应的死锁记录,死锁是因为两个事务同时操作一张有唯一索引的表,执行语句为insert,执行insert时,由于有唯一索引,两个事务都需要先获取对应行记录的S锁,然后再申请X锁。问题就来了,从库并行回放的时候事务一和事务二同时获得了同一行的S锁,并且都需要申请同一行的X锁,而X锁和S锁不兼容,事务一申请X锁需要等待事务二释放S锁,事务二申请X锁也需要等待事务一的S锁释放,都持有锁且互相等待对方释放,故形成了死锁。

解决方案:

临时解决方案:

从库死锁是因为MTS多线程并行回放事务造成的,临时将从库的slave_paraller_workers参数值从64调整为0,让从库变成单线程回放,即可避免死锁。临时调整完参数等待了约两小时,预计批量已经结束,将参数调整回64,从库延迟慢慢就追平了。

长久解决方案:

a)业务侧修改批量逻辑,避免产生锁冲突。

b)尽量避免使用唯一索引,唯一索引执行insert into replace语句时,会进入duplicate key判重逻辑,需要申请S锁,有把锁放大的情况。

相关推荐
SelectDB14 小时前
阶跃星辰基于 SelectDB 构建 PB 级 Agent 可观测平台
大数据·数据库·aigc
这个DBA有点耶16 小时前
GROUP BY优化全解:如何写出既不丢数据又飞快的分组查询
数据库·mysql·架构
掉头发的王富贵19 小时前
【StarRocks】极限十分钟入门StarRocks
数据库·sql·mysql
Nturmoils19 小时前
WHERE 条件别凭习惯写,常用查询先跑一遍
数据库
SamDeepThinking1 天前
一条UPDATE语句在MySQL 8.0中到底加了几把锁?
后端·mysql·程序员
Databend2 天前
在 AWS 中国峰会逛了一天,我在 Databend 展台看到了 Agent 数据基础设施的新思路
数据库·人工智能·agent
李白客3 天前
KES新版MySQL兼容能力再升级意味着什么?
mysql·国产数据库
ClouGence3 天前
Oracle 数据同步为什么会出现数据不一致?长事务是常被忽略的原因
数据库·后端·oracle
飞将3 天前
从零实现数据库(2)——HashIndex + IndexManager
数据库
Nturmoils4 天前
订单列表慢查询,先看 WHERE、ORDER BY 和 LIMIT
数据库