磁盘故障处理

目录

[🔍 一、初步检查:确认磁盘状态与内核报错](#🔍 一、初步检查:确认磁盘状态与内核报错)

[✅ 二、确认挂载状态与可写性](#✅ 二、确认挂载状态与可写性)

[🔍 三、只读坏道扫描(安全,不破坏数据)](#🔍 三、只读坏道扫描(安全,不破坏数据))

[🔧 四、深度检查:SMART 信息(整个磁盘)](#🔧 四、深度检查:SMART 信息(整个磁盘))

[✅ 五、后续建议](#✅ 五、后续建议)


🔍 一、初步检查:确认磁盘状态与内核报错

1.1 查看磁盘挂载与分区信息

复制代码
lsblk
df -h

1.2 检查内核是否已上报 I/O 错误(重点)

复制代码
dmesg | grep -i 'sdd1' | tail -50

⚠️ 关注以下关键词(说明已触发内核级 I/O 错误):

  • Buffer I/O error on dev sdd1, logical block 12345
  • lost page write due to I/O error on sdd1
  • EXT4-fs error
  • remounting filesystem read-only
✅ 二、确认挂载状态与可写性

2.1 检查挂载点是否正确

复制代码
mount | grep sdd1

期望输出

复制代码
/dev/sdd1 on /apsarapangu/disk8 type ext4 (rw,relatime,data=ordered)
  • ✅ 有输出且挂载点为 /apsarapangu/disk8,说明挂载正常。
  • ❌ 无输出 → 用 lsblk -fblkid 确认设备名是否正确。

2.2 验证文件系统是否可写

复制代码
cd /apsarapangu/disk8
echo "test" > test_write
cat test_write
rm test_write
  • ✅ 能正常读写,说明文件系统层未受保护。
  • ❌ 报错如:
    • Read-only file system → 文件系统被内核保护为只读。
    • Input/output error → 可能已出现坏道或文件系统损坏。
🔍 三、只读坏道扫描(安全,不破坏数据)
复制代码
sudo badblocks -sv /dev/sdd1
  • -s:显示进度
  • -v:详细输出
  • 默认只读模式,不会写入,安全

正常输出

复制代码
Pass completed, 0 bad blocks found.

异常输出(示例):

复制代码
12345
67890

这些数字是 逻辑块地址(LBA),表示读取失败的块。

🔧 四、深度检查:SMART 信息(整个磁盘)
复制代码
sudo smartctl -a /dev/sdd

⚠️ 注意:是 /dev/sdd(整个盘),不是 /dev/sdd1(分区)

重点字段

|--------------------------|-----------|-------|
| 字段名 | 含义 | 正常值 |
| Reallocated_Sector_Ct | 已重映射的坏扇区 | 0 |
| Current_Pending_Sector | 待映射的疑似坏扇区 | 0 |
| Offline_Uncorrectable | 无法修复的扇区 | 0 |

⚠️ 任一字段 非零 ,说明磁盘已出现 物理坏道即将失效 ,建议尽快更换磁盘

✅ 五、后续建议

|--------------------|--------------------------------------------------|
| 场景 | 建议 |
| badblocks 发现坏道 | 标记坏道(e2fsck -c),或更换磁盘 |
| SMART 指标异常 | 立即上报,准备换盘 |
| 文件系统只读 | 先卸载,执行 fsck -y /dev/sdd1,再重新挂载 |
| 盘古节点 | 若磁盘为数据盘,建议触发 ChunkServer 下线 → 换盘 → 上线 → 数据均衡 |

相关推荐
chao18984412 分钟前
完整MES系统实现 (C# 客户端服务器)
服务器·windows·c#
她说彩礼65万28 分钟前
C语言 文件
linux·服务器·c语言
txg66639 分钟前
自动驾驶领域热点简报(2026-04-26 ~ 2026-05-03)
linux·人工智能·自动驾驶
二哈赛车手1 小时前
新人笔记---ES和kibana启动问题以及一些常用的linux的错误排查方法,以及ES,数据库泄密解决方案[超详细]
java·linux·数据库·spring boot·笔记·elasticsearch
嵌入式×边缘AI:打怪升级日志1 小时前
嵌入式Linux开发核心自测题(全系列精华浓缩)
java·linux·运维
_codemonster1 小时前
系统分析师刷题系列--操作系统(二)
服务器·系统架构
嵌入式×边缘AI:打怪升级日志1 小时前
TinaSDK Linux Kernel 基本使用(全志T113开发板)
linux·运维·服务器
嵌入式×边缘AI:打怪升级日志1 小时前
Linux内核基础完全入门指南(理论篇)
linux·运维·服务器
Muyuan19982 小时前
28.Paper RAG Agent 开发记录:修复 LLM Rerank 的解析、Fallback 与可验证性
linux·人工智能·windows·python·django·fastapi
比昨天多敲两行2 小时前
Linux进程概念
linux·运维·服务器