CentOS下查看 ssd 寿命

SSD写入量达到设计极限,颗粒擦写寿命耗尽后会导致磁盘写入速度非常缓慢,读取正常。

使用smartctl及raid卡管理软件查看硬盘smart信息可以发现Media_Wearout_Indicator值降为1,表明寿命完全耗尽。

bash 复制代码
涉及范围
所有SSD

处理方案
查看SSD smart信息方法:

1、使用storcli64查看阵列卡下挂载的设备序号
./storcli64 -pdlist -a0 |grep Id |awk '{print $3}'

Device Id: 17
Device Id: 18
......

2、根据磁盘Media_Wearout_Indicator值判断是否寿命耗尽
smartctl -a --device=sat+megaraid,17 /dev/sda | grep 'Media_Wearout_Indicator'
smartctl -a --device=sat+megaraid,18 /dev/sdb | grep 'Media_Wearout_Indicator'

其中sda,sdb为硬盘所属raid在OS下的盘符

3、 固态硬盘的保修期除了会受到使用年限的影响之外,还可能会受到能够写入硬盘的最大数据量的影响,最大数据量由硬盘的具体生产厂家以及具体型号决定。如果经浪潮公司鉴定,硬盘的写入数据量已达到或超过最大限制,浪潮公司将不会按照保修政策予以维修和更换"

故障根因
SSD闪存颗粒寿命耗尽

********************************************
smart完整输出

SMART Attributes Data Structure revision number: 1

Vendor Specific SMART Attributes with Thresholds:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE

  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       0

  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       9738

 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       8

170 Unknown_Attribute       0x0033   100   100   010    Pre-fail  Always       -       0

171 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0

172 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0

174 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       6

175 Program_Fail_Count_Chip 0x0033   100   100   010    Pre-fail  Always       -       283468968878

183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0

184 End-to-End_Error        0x0033   100   100   090    Pre-fail  Always       -       0

187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0

190 Airflow_Temperature_Cel 0x0022   075   075   000    Old_age   Always       -       25 (Min/Max 18/25)

192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       6

194 Temperature_Celsius     0x0022   100   100   000    Old_age   Always       -       25

197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0

199 UDMA_CRC_Error_Count    0x003e   100   100   000    Old_age   Always       -       0

225 Unknown_SSD_Attribute   0x0032   100   100   000    Old_age   Always       -       68389846

226 Unknown_SSD_Attribute   0x0032   100   100   000    Old_age   Always       -       55828

227 Unknown_SSD_Attribute   0x0032   100   100   000    Old_age   Always       -       0

228 Power-off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       584249

232 Available_Reservd_Space 0x0033   100   100   010    Pre-fail  Always       -       0

233 Media_Wearout_Indicator 0x0032   046   046   000    Old_age   Always       -       0

234 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0

241 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -       68389846

242 Total_LBAs_Read         0x0032   100   100   000    Old_age   Always       -       1011

243 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       78504917

intel SSD
bash 复制代码
232 Available_Reservd_Space 0x0033   100   100   010    Pre-fail  Always       -       0

233 Media_Wearout_Indicator 0x0032   046   046   000    Old_age   Always       -       0

http://www.zhongyaoit.com/news/industry/315.html

bash 复制代码
CentOS下查看 ssd 寿命

安装必要的软件

yum install -y MegaCli Lib_Utils

得到 device id

/opt/MegaRAID/MegaCli/MegaCli64 -LdPdInfo -aALL | grep -B 30 'Solid State Device' | grep 'Device Id' 

我这里得到的是 1, 下面用 smartctl 的时候跟上 ,1

smartctl -a -d sat+megaraid,1 /dev/sdc | grep Media_Wearout_Indicator

Wear Levelling Count(颗粒平均擦写次数):最后一列为 0,即这块硬盘的全盘写入/擦除(P/E)数为 0 次,显示还有 100% 的寿命.

 ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 233 Media_Wearout_Indicator 0x0032 100 100 000 Old_age Always - 0
相关推荐
剑神一笑16 分钟前
Linux lsof 命令深度解析:从文件描述符到进程追踪
linux·运维·php
andlbds1 小时前
解决Ubuntu20.04进入系统卡死在厂商Logo界面问题
linux·ubuntu
MIXLLRED1 小时前
解决: Ubuntu 22.04上树莓派4B扩展板ROS2兼容性修复指南
linux·ubuntu·树莓派
zizle_lin1 小时前
CentOS配置yum源
linux·运维·centos
武器大师721 小时前
从零开始在 Linux 上编译运行 lvgljs 图形界面项目
linux·运维·服务器
剑神一笑1 小时前
Linux free 命令深度解析:从内存监控到 OOM 排查的完整指南
linux·运维·服务器
似水এ᭄往昔2 小时前
【Linux网络编程】--计算机网络基础
linux·网络·计算机网络
leaves falling2 小时前
深入理解Linux进程控制:从fork到exec,手写一个迷你Shell
linux·运维·服务器
思麟呀2 小时前
C++工业级日志项目(七)日志器核心
linux·开发语言·c++·windows
满天星83035773 小时前
【Git】原理及使用(二) (版本回退)
linux·git