高效诊断Linux性能问题

学习向前冲2024-09-09 20:13

从uptime命令开始；这里的关键指标是平均负载，它显示了过去
1分钟，5分钟和15分钟内正在运行或等待资源的进程平均数量；如果这些数字持续高于CPU内核数，则可能表明进程正在争夺资源，提示我们使用其他工具深入研究

1.使用top工具；top提供了系统流程和关键指标的动态，持续更新的视图；它就像系统性能的仪表盘；
需要关注的关键指标是用户进程和系统进程占用CPU的百分比；top还会显示正在运行的进程列表，密切关注CPU或内存消耗比列异常搞得进程（top提供的是当前时刻的快照，要想了解更全面的情况，需要长期观察。）

2.vmstat命令可以同时显示多个系统组件，并实时更新，需要关注的关键领域包括CPU部分的CPU队列，IO等待，交换活动和io等待时间

3.要深入了解磁盘IO，我们可以使用iostat；他可以让我们连续查看磁盘活动，需要关注的关键指标是磁盘活动的每秒事务数和CPU部分IO操作等待时间的百分比

iostat按设备细分IO操作，当需要确定哪个磁盘导致性能问题时，很有用

4.netstat，监控网络连接工具

列出说有活动连接，包括传入和传出连接，它有助于识别系统上的开放端口和活动服务

还可以计算特定端口的连接数 netstat -an | grep -c ':80' 它可以快速衡量特定服务的负载，如果我们看到异常高的连接
数，可能表明存在潜在的性能问题或需要调查的流量高峰

5.sar系统活动报告程序，它可以保存历史数据

符：

|---------|
| Tools |
| top |
| vmstat |
| iostat |
| netstat |