高效诊断Linux性能问题

从uptime命令开始;这里的关键指标是平均负载,它显示了过去
1分钟,5分钟和15分钟内正在运行或等待资源的进程平均数量;如果这些数字持续高于CPU内核数,则可能表明进程正在争夺资源,提示我们使用其他工具深入研究

1.使用top工具;top提供了系统流程和关键指标的动态,持续更新的视图;它就像系统性能的仪表盘;
需要关注的关键指标是用户进程和系统进程占用CPU的百分比;top还会显示正在运行的进程列表,密切关注CPU或内存消耗比列异常搞得进程(top提供的是当前时刻的快照,要想了解更全面的情况,需要长期观察。)

2.vmstat命令可以同时显示多个系统组件,并实时更新,需要关注的关键领域包括CPU部分的CPU队列,IO等待,交换活动和io等待时间

3.要深入了解磁盘IO,我们可以使用iostat;他可以让我们连续查看磁盘活动,需要关注的关键指标是磁盘活动的每秒事务数和CPU部分IO操作等待时间的百分比

iostat按设备细分IO操作,当需要确定哪个磁盘导致性能问题时,很有用

4.netstat,监控网络连接工具

列出说有活动连接,包括传入和传出连接,它有助于识别系统上的开放端口和活动服务

还可以计算特定端口的连接数 netstat -an | grep -c ':80' 它可以快速衡量特定服务的负载,如果我们看到异常高的连接
数,可能表明存在潜在的性能问题或需要调查的流量高峰

5.sar系统活动报告程序,它可以保存历史数据

符:

|---------|
| Tools |
| top |
| vmstat |
| iostat |
| netstat |

相关推荐
运维-大白同学19 分钟前
将django+vue项目发布部署到服务器
服务器·vue.js·django
糖豆豆今天也要努力鸭27 分钟前
torch.__version__的torch版本和conda list的torch版本不一致
linux·pytorch·python·深度学习·conda·torch
烦躁的大鼻嘎35 分钟前
【Linux】深入理解GCC/G++编译流程及库文件管理
linux·运维·服务器
乐大师36 分钟前
Deepin登录后提示“解锁登陆密钥环里的密码不匹配”
运维·服务器
ac.char42 分钟前
在 Ubuntu 上安装 Yarn 环境
linux·运维·服务器·ubuntu
敲上瘾42 分钟前
操作系统的理解
linux·运维·服务器·c++·大模型·操作系统·aigc
长弓聊编程1 小时前
Linux系统使用valgrind分析C++程序内存资源使用情况
linux·c++
cherub.1 小时前
深入解析信号量:定义与环形队列生产消费模型剖析
linux·c++
梅见十柒2 小时前
wsl2中kali linux下的docker使用教程(教程总结)
linux·经验分享·docker·云原生
Koi慢热2 小时前
路由基础(全)
linux·网络·网络协议·安全