Linux性能排查实战:从“系统慢”到精准定位

大家好,我是刘叨叨,一个致力于让碎片化技术系统性的运维人。

监控大盘一片"绿色",业务却喊"卡爆了"?别慌,今天分享一套直击要害的排查心法,让你快速把模糊的"系统慢"变成清晰的定位结论。

一、核心思路:先找方向,再抓元凶

遇到性能问题,别乱试。记住这个黄金三步法:

  1. 定方向:是CPU、内存、磁盘I/O,还是网络的问题?
  2. 抓进程:是哪个具体进程在"搞事情"?
  3. 下结论:资源不足?程序BUG?还是配置有误?

二、CPU排查:谁在疯狂计算?

命令 关键参数/操作 核心看什么
top 运行后按1 (看各核),P (按CPU排序),M(按内存排序) %Cpu(s)行:•us高:应用自己算得多。•wa高:CPU在等I/O,该去查磁盘。
pidstat -u 1 -u:看CPU。1:每秒采样1次。 %CPU列 :精准找到高CPU消耗的进程ID(PID)
vmstat 1 1:每秒输出一行。 r列:等待运行的进程数。持续大于CPU核数,说明CPU不够用了。

三、内存排查:真的内存不足?

Linux爱用空闲内存做缓存(Cached),所以看内存要"聪明点"。

命令 关键参数 核心看什么
free -h -h:用G/M显示,好读。 available列 :系统真正可用的内存。只关心这个数。
pidstat -r 1 -r:看内存。 RSS列 :进程实际占用的物理内存,找"内存大户"。

📌 重要经验 :看到free内存少别慌,看available。只有它快没了,且开始用Swap(交换分区)时,才是真危机,性能会暴跌。

四、磁盘I/O排查:找到拖后腿的"慢盘"

命令 关键参数/操作 核心看什么
iostat -x 1 -x:看详细指标。1:每秒刷新。 %util :磁盘使用率。>80%就很忙。•await:I/O平均响应时间(ms),越大越"卡"。
iotop 运行后按o:只显示活跃I/O进程。 DISK READ/WRITE列:实时看到哪个进程在读/写磁盘。

五、网络排查:连接堵了还是带宽满了?

命令 关键参数 核心看什么
ss -antp -a:所有。-t:TCP。-p:显示进程。 连接状态:检查ESTAB(正常连接)和TIME-WAIT(等待关闭)是否过多。
sar -n DEV 1 -n DEV:看网卡。1:每秒采样。 rxkB/s ,txkB/s:进出口流量,判断带宽是否打满。

六、📦 最小化安装必备(CentOS 7)

很多命令默认没有,先装好:

复制代码
# 安装性能工具包(含iostat, pidstat, sar等)
yum install -y sysstat
# 安装进程级IO监控工具
yum install -y iotop

七、终极心法:一张图看懂排查路径

复杂的逻辑,一张图就够了。按这个顺序来,思路永不乱:

心法精髓top总览仪表盘 ,告诉你哪里亮红灯;pidstat/iotop精准探测器,深入问题区域抓出具体进程。

八、总结

记住,命令只是工具,核心是解读指标和关联线索的能力 。当你能把%wa高、await飙升、iotop里的疯狂进程这几条信息,瞬间组合成 "数据库备份任务导致磁盘IO瓶颈" 的结论时,你就真正掌握了性能排查的钥匙。


关注【刘叨叨趣味运维】公众号,用有趣的方式,啃下最硬核的技术。咱们下期见!

相关推荐
薛定猫AI1 天前
Codex 与 Claude Code 全平台安装配置指南(Windows / macOS / Linux)
linux·windows·macos
kidwjb1 天前
信号量在进程中的使用
linux·进程间通信
sulikey1 天前
个人Linux操作系统学习笔记2 - gcc与库的理解
linux·笔记·学习·操作系统·gcc·
二宝哥1 天前
Linux虚拟机网络配置
linux·运维·服务器
陳10301 天前
Linux:进程间通信 和 简单进程池
linux·运维·服务器
jimy11 天前
改.bashrc,直观地判断本地repo是否有改动
linux·服务器
愚昧之山绝望之谷开悟之坡1 天前
什么是Linter?什么是沙箱!
linux·笔记
babytiger1 天前
Gitea 重安装 + Snap 数据迁移完整流程总结
linux·elasticsearch·gitea
匆匆那年9671 天前
远程 Linux 校园网认证操作手册(本地浏览器法)
linux·运维·服务器
newnazi1 天前
RedHat10 安装MS SQL Server2025
linux·服务器·数据库