CPU
top
:内核/用户进程占用CPU比例procinfo
/cat /proc/interrupts
:查看中断次数和频率,造成中断数量较高的设备oprofile
:内核函数消耗时间和函数功能time
:进程在内核和用户空间花费的时间strace
/oprofile
:进程在那些系统调用上花费的时间ltrace
/oprofile
:进程在那些函数花费的时间
内存
slabtop
:内核使用内存是否增加/使用量过大slabtop
:排序内核使用内存的对象情况,用于确定用于文件/子系统top
/ps
:查看物理内存是否增加/proc/<pid>/status
查看内存使用情况- VmExe 值很大,则说明可执行文件本身很大,需要确定哪些函数文本比较大。
- VmLib 很大,则说明应用程序使用了大量或者体积比较大的共享库,需要确定哪些库导致了 VmLib 很大。
- VmData 较大并在增加,说明进程的数据区或堆在增加。
gdb attach
进程,根据调用栈信息计算当前栈指针和前一个栈指针的差值,这个差值即为函数的栈容量,找到栈容量比较大的函数。memprof
找到哪些函数分配了堆内存并观察哪些进程的堆内存在增加,确定是否存在不合理的分配或者内存泄漏问题。/proc/<pid>/maps
查看进程使用了哪些共享库和以及这些库的大小,对于太大的共享库是否可能替换成大小更小的版本。或者某个库已经被其他进程加载到内存使用,只是版本不同,则可以改成共用一个版本。nm
命令排序进程符号大小,找出文本段较大的函数看是否可以删除或者减小其大小。ipcs
查看共享内存信息,是否存在过大或者共享内存数量不断增加。ipcs -p
查看哪些进程创建和使用了共享内存。对于共享内存过大问题,可以查看其程序代码看分配是否合理。对于共享内存数不断增加,是否存在创建后未删除等问题。
磁盘I/O
iotop
找到产生大量 IO 的进程。strace
跟踪高 IO 进程与文件操作相关的系统调用,查看其调用详情和耗时时长,找到耗时长的读写操作。并通过其操作的文件描述符 fd 映射回磁盘上的文件,了解为什么需要读写这些文件,进而查看是否可以优化。
网络I/O
ethool
查看网卡的最大流量限制iptraf
查看流经端口的流量是否饱和ifconfig
/ip
命令查看网络接口是否产生大量错误,如果是可能是硬件配置的有问题,联系网管帮忙排查解决。iptraf
查看流量类型(协议/端口号)。netstat
查看是否有进程在流经该网络端口的流量。strace
/lsof
找到是哪个套接字产生了这些通信流量。