性能分析排查思路之机器(2)

前言

本文是性能问题分析排查思路的展开内容之一,第2篇,主要分为日志1期,机器4期、环境2期共7篇系列文章,本期是第二篇,讲机器(硬件)的存储方面的分析方法和经验、最佳实践。

机器上主要有磁盘(存储)、网络、内存和CPU四大硬件模块。其中磁盘方面是故障率、瓶颈率最高的一个部件。

对于Linux环境性能问题的排查,我们首先需要看的就是磁盘的情况。

了解构成

  • 分为RAID和非RAID的情况。RAID之后的磁盘阵列情况如果不清楚,可以使用MegaCli这个神器进行查询。 查询截图:

RAID级别对应关系:

  • Primary-1, Secondary-0, RAID Level Qualifier-0 RAID 1

  • Primary-0, Secondary-0, RAID Level Qualifier-0 RAID 0

  • Primary-5, Secondary-0, RAID Level Qualifier-3 RAID 5

  • Primary-1, Secondary-3, RAID Level Qualifier-0 RAID 10

  • 没有做RAID的磁盘,可以直接使用smartctl了解磁盘的属性。 执行命令:smartctl -i /dev/sdb的主要结果:

结果关注:厂家、产品型号、容量、转速7200,SAS传输协议等。

  • 可以使用lsblk命令查看磁盘的挂载情况,以及文件系统类型。

结果可以看到多数是xfs文件系统,且能查到UUID等信息。

  • 此外,可以使用lshw查看磁盘信息。

lshw -class disk命令的输出与smart信息类似,也可以看型号、序列号和转速信息,此外可以看到逻辑设备名称。

确认空间

  • df -h 主要看下是否存在磁盘空间使用耗尽的情况!生产上许多奇怪的问题可能是磁盘写满导致的!

查看速率

  • 使用sar -dp 3 5这个命令查看实时速率。

主要关注最列一列的使用率,达到100%说明读写请求过多,具体什么负载高可以看前面几列的数据。

  • 一般磁盘使用率存在问题的话,通过实时查看读写请求情况可以了解。

检测坏盘

  • smartctl -a查看Health字段
  • badblocks 命令,不能检测太大的盘
  • 一般磁盘故障的话机器的磁盘会有具体的告警,或者日志有I/O Error。

结语

本文探讨了与磁盘和文件系统相关的各种命令及其在性能分析中的应用。这些命令不仅可以帮助我们诊断和解决磁盘与文件系统的常见问题,还能提供宝贵的性能数据,从而优化系统的整体表现。

最后,我们要强调的是,磁盘和文件系统的性能对于整个系统的运行至关重要。因此,我们应该时刻关注其健康状况,并采取必要的措施来预防潜在的问题。

相关推荐
yy里1 小时前
H5性能优化实践
前端·性能优化
二川bro2 小时前
第十篇:3D模型性能优化:从入门到实践
3d·性能优化
国科安芯3 小时前
MCU外设初始化:为什么参数配置必须优先于使能
网络·单片机·嵌入式硬件·性能优化·硬件工程
广东小69 小时前
【昇腾】关于Atlas 200I A2加速模块macro0配置3路PCIE+1路SATA在hboot2中的一个bug_20250812
学习·性能优化
真实的菜13 小时前
MyBatis高级特性与性能优化:从入门到精通的实战指南
性能优化·mybatis
在未来等你16 小时前
RabbitMQ面试精讲 Day 20:RabbitMQ压测与性能评估
性能优化·消息队列·rabbitmq·压力测试·性能测试·面试题
要开心吖ZSH2 天前
大数据量下分页查询性能优化实践(SpringBoot+MyBatis-Plus)
spring boot·性能优化·mybatis
Code季风2 天前
如果缓存和数据库更新失败,如何实现最终一致性?
数据库·分布式·缓存·微服务·性能优化
小马敲马2 天前
[4.2-2] NCCL新版本的register如何实现的?
开发语言·c++·人工智能·算法·性能优化·nccl
今禾2 天前
瀑布流布局:从原理到实战的完整指南
前端·css·性能优化