高效诊断Linux性能问题

从uptime命令开始;这里的关键指标是平均负载,它显示了过去
1分钟,5分钟和15分钟内正在运行或等待资源的进程平均数量;如果这些数字持续高于CPU内核数,则可能表明进程正在争夺资源,提示我们使用其他工具深入研究

1.使用top工具;top提供了系统流程和关键指标的动态,持续更新的视图;它就像系统性能的仪表盘;
需要关注的关键指标是用户进程和系统进程占用CPU的百分比;top还会显示正在运行的进程列表,密切关注CPU或内存消耗比列异常搞得进程(top提供的是当前时刻的快照,要想了解更全面的情况,需要长期观察。)

2.vmstat命令可以同时显示多个系统组件,并实时更新,需要关注的关键领域包括CPU部分的CPU队列,IO等待,交换活动和io等待时间

3.要深入了解磁盘IO,我们可以使用iostat;他可以让我们连续查看磁盘活动,需要关注的关键指标是磁盘活动的每秒事务数和CPU部分IO操作等待时间的百分比

iostat按设备细分IO操作,当需要确定哪个磁盘导致性能问题时,很有用

4.netstat,监控网络连接工具

列出说有活动连接,包括传入和传出连接,它有助于识别系统上的开放端口和活动服务

还可以计算特定端口的连接数 netstat -an | grep -c ':80' 它可以快速衡量特定服务的负载,如果我们看到异常高的连接
数,可能表明存在潜在的性能问题或需要调查的流量高峰

5.sar系统活动报告程序,它可以保存历史数据

符:

|---------|
| Tools |
| top |
| vmstat |
| iostat |
| netstat |

相关推荐
程序员zgh2 分钟前
Linux 系统调用
linux·运维·服务器·c语言·c++·系统安全
Stuomasi_xiaoxin6 分钟前
ROS2介绍,及ubuntu22.04 安装ROS 2部署使用!
linux·人工智能·深度学习·ubuntu
带土110 分钟前
2. Linux下FFmpeg C++音视频解码+推流开发
linux·c++·ffmpeg
cly121 分钟前
Ansible自动化(十二):Jinja2过滤器
运维·自动化·ansible
P-ShineBeam23 分钟前
八卡A100服务器坏卡引发 CUDA initialization: cudaGetDeviceCount()异常
运维·服务器·人工智能·语言模型
zhanglb1223 分钟前
Linux -kylin麒麟系统安装openSSH
linux·apache kylin
zhanglb1226 分钟前
Linux-麒麟系统安装内网穿透工具
linux·apache kylin
飞凌嵌入式32 分钟前
解析一下面向教育领域的RV1126B\RK3506B\RK3576开发板
linux·人工智能
Xの哲學35 分钟前
Linux io_uring 深度剖析: 重新定义高性能I/O的架构革命
linux·服务器·网络·算法·边缘计算
萤丰信息37 分钟前
开启园区“生命体”时代——智慧园区系统,定义未来的办公与生活
java·大数据·运维·数据库·人工智能·生活·智慧园区