一次完整的 MySQL 性能问题排查思路（线上实战总结）

一、为什么很多性能问题越查越乱？

很多人排查数据库性能问题，第一反应是：

查慢 SQL
看索引
explain 一下

如果没发现问题，就开始：

怀疑数据库
怀疑服务器
怀疑网络

结果就是：
越查越碎，越查越没方向。

真正的问题不是能力不够，而是------
一开始就没有"整体排查路径"。

二、先说结论：数据库性能问题，本质只有三类

所有线上 MySQL 性能问题，最终都能归到这三类之一：

SQL 执行慢
资源被占满
使用方式错误

如果你排查时心里没有这三类，很容易被表象带偏。

三、第一步：不要急着看 SQL

这是最容易犯的错误。

在你打开慢 SQL 日志之前，先问自己三个问题：

当前 QPS 高不高？
并发连接数是否异常？
接口 RT 是整体慢，还是个别慢？

如果是：

整体慢 → 很可能不是单条 SQL 的问题
QPS 不高但很慢 → 八成是连接、事务、锁

这一步，是给整个排查"定方向"。

四、第二步：先看连接，再看 SQL

这是我线上最常用、也最有效的一步。

重点看三件事：

当前连接数
Sleep 连接是否持续增长
是否存在大量长连接

如果你看到：

连接数长期居高不下
Sleep 连接越来越多

基本可以确定：

数据库不是慢在执行，而是慢在"被占着"。

五、第三步：排查长事务和锁等待

这一步，很多人会忽略，但杀伤力极大。

关注点包括：

是否有事务执行时间异常
是否在事务中做了业务逻辑
是否存在锁等待堆积

长事务的可怕之处在于：

它本身不一定慢
但会拖慢所有后续请求

数据库性能，往往是被"少量长事务"拖垮的。

六、第四步：确认是不是"读压力问题"

当你发现：

写并不多
慢 SQL 不明显
连接数却持续上涨

这时候一定要警惕：

高并发读正在压垮数据库。

常见信号包括：

所有请求都直连数据库
缓存命中率低
页面刷新、轮询频繁

记住一句话：

读多写少，不代表数据库压力小。

七、第五步：判断问题在"数据库"还是"架构"

这是一个非常关键的分界点。

如果问题是：

单条 SQL 慢
索引不合理

那是 数据库问题。

但如果是：

连接耗尽
事务太长
高并发读
缓存缺失

那已经是 架构问题，不是靠优化 SQL 能解决的。

八、一个我一直遵循的排查顺序

这是我自己线上总结的一套固定顺序：

看现象（RT、QPS、报错）
看连接（数量、状态）
看事务（是否过长）
看锁（是否等待堆积）
再看 SQL

这个顺序能帮你避开 80% 的无效排查。

九、为什么很多数据库"越优化越慢"？

因为方向错了。

当问题本质是：

系统设计
使用方式
流量模型

你却一直在：

改 SQL
加索引
调参数

结果只能是：

治标不治本，甚至适得其反。

十、写在最后

数据库性能问题，很少是"突然发生"的。

它通常是：

设计阶段埋下隐患
流量增长逐步放大
最终集中爆发

真正成熟的工程师，不是 SQL 写得多快，而是：

知道什么时候该优化 SQL，
什么时候该停下来改架构。

本回答基于网络搜索结果整理而成，内容仅供参考。由于信息可能随时间变化或存在误差，建议用户自行核实关键信息。对于因使用或依赖本回答内容而导致的任何损失或损害，概不负责。