目录
[🔍 一、初步检查:确认磁盘状态与内核报错](#🔍 一、初步检查:确认磁盘状态与内核报错)
[✅ 二、确认挂载状态与可写性](#✅ 二、确认挂载状态与可写性)
[🔍 三、只读坏道扫描(安全,不破坏数据)](#🔍 三、只读坏道扫描(安全,不破坏数据))
[🔧 四、深度检查:SMART 信息(整个磁盘)](#🔧 四、深度检查:SMART 信息(整个磁盘))
[✅ 五、后续建议](#✅ 五、后续建议)
🔍 一、初步检查:确认磁盘状态与内核报错
1.1 查看磁盘挂载与分区信息
lsblk
df -h
1.2 检查内核是否已上报 I/O 错误(重点)
dmesg | grep -i 'sdd1' | tail -50
⚠️ 关注以下关键词(说明已触发内核级 I/O 错误):
Buffer I/O error on dev sdd1, logical block 12345lost page write due to I/O error on sdd1EXT4-fs errorremounting filesystem read-only
✅ 二、确认挂载状态与可写性
2.1 检查挂载点是否正确
mount | grep sdd1
✅ 期望输出:
/dev/sdd1 on /apsarapangu/disk8 type ext4 (rw,relatime,data=ordered)
- ✅ 有输出且挂载点为
/apsarapangu/disk8,说明挂载正常。 - ❌ 无输出 → 用
lsblk -f或blkid确认设备名是否正确。
2.2 验证文件系统是否可写
cd /apsarapangu/disk8
echo "test" > test_write
cat test_write
rm test_write
- ✅ 能正常读写,说明文件系统层未受保护。
- ❌ 报错如:
-
Read-only file system→ 文件系统被内核保护为只读。Input/output error→ 可能已出现坏道或文件系统损坏。
🔍 三、只读坏道扫描(安全,不破坏数据)
sudo badblocks -sv /dev/sdd1
-s:显示进度-v:详细输出- 默认只读模式,不会写入,安全
✅ 正常输出:
Pass completed, 0 bad blocks found.
❌ 异常输出(示例):
12345
67890
这些数字是 逻辑块地址(LBA),表示读取失败的块。
🔧 四、深度检查:SMART 信息(整个磁盘)
sudo smartctl -a /dev/sdd
⚠️ 注意:是 /dev/sdd(整个盘),不是 /dev/sdd1(分区)
重点字段:
|--------------------------|-----------|-------|
| 字段名 | 含义 | 正常值 |
| Reallocated_Sector_Ct | 已重映射的坏扇区 | 0 |
| Current_Pending_Sector | 待映射的疑似坏扇区 | 0 |
| Offline_Uncorrectable | 无法修复的扇区 | 0 |
⚠️ 任一字段 非零 ,说明磁盘已出现 物理坏道 或 即将失效 ,建议尽快更换磁盘。
✅ 五、后续建议
|--------------------|--------------------------------------------------|
| 场景 | 建议 |
| badblocks 发现坏道 | 标记坏道(e2fsck -c),或更换磁盘 |
| SMART 指标异常 | 立即上报,准备换盘 |
| 文件系统只读 | 先卸载,执行 fsck -y /dev/sdd1,再重新挂载 |
| 盘古节点 | 若磁盘为数据盘,建议触发 ChunkServer 下线 → 换盘 → 上线 → 数据均衡 |