MySQL CPU飙升至500%的深度排查与优化实践

引言

在数据库运维中,MySQL CPU使用率突然飙升至500%是多核服务器上常见的紧急故障。本文结合实际案例,从系统诊断到SQL优化,提供一套完整的排查方案和可复现的代码示例。

一、系统级诊断

1.1 确认资源占用来源

bash 复制代码
bash

# 使用top命令定位高CPU进程
top -b -n 1 | grep mysqld
# 或使用htop可视化查看
htop --sort-key PERCENT_CPU

若发现非mysqld进程占用过高,可通过以下命令定位:

bash 复制代码
bash

ps aux | sort -nrk 3 | head -10

1.2 实时监控工具

bash 复制代码
bash

# 使用pidstat监控具体进程资源
pidstat -p $(pgrep mysqld) 1 5

二、MySQL内部诊断

2.1 会话分析

sql 复制代码
sql

-- 查看活跃会话
SHOW FULL PROCESSLIST;

-- 高级会话分析(MySQL 8.0+)
SELECT 
    THREAD_ID, 
    OS_THREAD_ID,
    COMMAND,
    STATE,
    TIME,
    SQL_TEXT
FROM performance_schema.threads
JOIN performance_schema.events_statements_history
    USING(THREAD_ID)
WHERE COMMAND != 'Sleep'
ORDER BY TIME DESC;

2.2 慢查询定位

sql 复制代码
sql

-- 启用慢查询日志(需提前配置)
SET GLOBAL slow_query_log = 'ON';
SET GLOBAL long_query_time = 2;

-- 查询慢日志
SELECT * FROM mysql.slow_log 
WHERE start_time > NOW() - INTERVAL 1 HOUR;

三、SQL优化实践

3.1 执行计划分析

sql 复制代码
sql

EXPLAIN 
SELECT * FROM orders 
WHERE user_id = 1000 
  AND status = 'completed';

输出示例:

bash 复制代码
+----+-------------+--------+------+---------------+------+---------+------+------+----------+-------------+
| id | select_type | table  | type | possible_keys | key  | key_len | ref  | rows | Extra    |
+----+-------------+--------+------+---------------+------+---------+------+------+----------+-------------+
|  1 | SIMPLE      | orders | ref  | idx_user      | idx_user | 5     | const|   10 | Using where|
+----+-------------+--------+------+---------------+------+---------+------+------+----------+-------------+

3.2 索引优化案例

sql 复制代码
sql

-- 缺失索引检测
SELECT 
    TABLE_NAME,
    COLUMN_NAME,
    POS
FROM INFORMATION_SCHEMA.STATISTICS
WHERE TABLE_SCHEMA = 'ecommerce'
AND TABLE_NAME = 'orders'
ORDER BY INDEX_NAME;

-- 添加复合索引
ALTER TABLE orders ADD INDEX idx_user_status (user_id, status);

四、连接数激增处理

4.1 连接池配置检查

sql 复制代码
sql

SHOW VARIABLES LIKE 'max_connections';
SHOW STATUS LIKE 'Threads_connected';

4.2 连接数控制

sql 复制代码
sql

-- 临时降低连接数
SET GLOBAL max_connections = 500;

-- 永久修改(my.cnf)
[mysqld]
max_connections=500

五、高级优化技术

5.1 查询缓存优化

sql 复制代码
sql

-- MySQL 8.0+ 已移除查询缓存
-- 替代方案:使用Redis缓存
SELECT * FROM orders WHERE id=1000;

5.2 线程池优化

sql 复制代码
sql

-- MySQL 8.0+ 线程池配置
[mysqld]
thread_handling=pool-of-threads
thread_pool_size=16

六、自动化监控脚本

bash 复制代码
bash

#!/bin/bash
# cpu_monitor.sh

THRESHOLD=500
CURRENT=$(top -b -n1 | grep mysqld | awk '{print $9}')

if (( $(echo "$CURRENT > $THRESHOLD" | bc -l) )); then
    echo "[$(date)] MySQL CPU usage exceeds $THRESHOLD%" >> /var/log/mysql_alert.log
    mysql -e "SELECT * FROM information_schema.processlist WHERE COMMAND != 'Sleep' AND TIME > 60"
fi

总结

处理MySQL CPU飙升需要系统化的诊断流程:从系统级监控到MySQL内部诊断,再到SQL优化和连接数控制。通过本文提供的代码示例和实战经验,DBA可以快速定位问题并进行针对性优化。建议定期进行慢查询审计和索引优化,建立完善的监控告警机制,确保数据库稳定高效运行。

相关推荐
zuoerjinshu2 小时前
sql实战解析-sum()over(partition by xx order by xx)
数据库·sql
NocoBase3 小时前
【2.0 教程】第 1 章:认识 NocoBase ,5 分钟跑起来
数据库·人工智能·开源·github·无代码
Hoshino.415 小时前
基于Linux中的数据库操作——下载与安装(1)
linux·运维·数据库
Oueii6 小时前
Django全栈开发入门:构建一个博客系统
jvm·数据库·python
未来龙皇小蓝6 小时前
【MySQL-索引调优】11:Group by相关概念
数据库·mysql·性能优化
2401_831824967 小时前
使用Fabric自动化你的部署流程
jvm·数据库·python
njidf7 小时前
Python日志记录(Logging)最佳实践
jvm·数据库·python
twc8297 小时前
大模型生成 QA Pairs 提升 RAG 应用测试效率的实践
服务器·数据库·人工智能·windows·rag·大模型测试
@我漫长的孤独流浪7 小时前
Python编程核心知识点速览
开发语言·数据库·python
2401_851272997 小时前
实战:用Python分析某电商销售数据
jvm·数据库·python