【Linux故障排查】系统启动进入紧急模式:由磁盘挂载超时引发的服务器无法启动

前言

最近在处理一台 Linux 服务器(CentOS)时,遇到了一个典型的启动故障。系统无法正常进入多用户模式,而是直接掉进了 Emergency Mode(紧急模式)

1. 故障现象

系统启动过程中卡住,最终提示输入 root 密码进行维护。屏幕主要报错信息如下:

复制代码
[FAILED] Failed to start Load Kernel Modules.
Welcome to emergency mode!
Give root password for maintenance (or press Control-D to continue):

2. 日志分析与根因定位

在紧急模式下输入 root 密码登录后,使用 journalctl -xb 查看详细的启动日志。我们会发现一连串的红色报错,例如:

复制代码
Failed to start Security Auditing Service.
Dependency failed for Local File Systems.
Job registry\x2data.mount/start failed with result 'dependency'.

关键点来了: 虽然报错很多,但我们需要找到 "万恶之源"。在日志中,有一条关于设备超时的记录至关重要:

复制代码
dev-disk-by\x2duuid-7d98cda6...device has failed
Unit dev-disk-by\x2duuid-7d98cda6...device/start timed out.

逻辑推导

  1. 根本原因(Root Cause): 系统试图挂载一个 UUID 为 7d98cda6... 的磁盘设备,但是**超时(Timed Out)**了。这意味着系统找不到这块盘,或者盘响应太慢。
  2. 直接后果: 该磁盘对应的挂载点 /registry-data 挂载失败 (registry\x2data.mount failed)。
  3. 连锁反应 A: 因为本地文件系统没有完全就绪 (local-fs.target failed),导致依赖它的 SELinux 策略迁移服务失败。
  4. 连锁反应 B: 审计服务 auditd 可能依赖某些日志路径或文件系统状态,也随之启动失败。

结论: 不要被 auditdSELinux 的报错误导,真正的问题在于那个找不到的磁盘分区。

3. 解决方案与排查步骤

在 Emergency Mode 下,我们可以执行以下操作来修复问题。

通常这种问题是因为 /etc/fstab 里写了一个不存在的磁盘,或者磁盘 UUID 变了。

  1. 查看当前的挂载配置:

    [root@xh-tdc-003 ~]# cat /etc/fstab

    /etc/fstab

    Created by anaconda on Fri Mar 22 13:11:35 2024

    Accessible filesystems, by reference, are maintained under '/dev/disk'

    See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info

    /dev/mapper/centos-root / xfs defaults 0 0
    UUID=48190fb2-d2e8-4ffe-b8db-87b5a001143a /boot xfs defaults 0 0
    /dev/mapper/centos-home /home xfs defaults 0 0
    UUID=89f15833-91ec-489c-b109-396689336d4b /var/lib/docker xfs defaults,uquota,pquota 0 0
    UUID=51554af9-9dae-4083-9ebf-853120f5b88c /var/log xfs defaults 0 0
    UUID=23855409-885d-4394-a174-6b2a11d2ee15 /opt/kubernetes/data xfs defaults 0 0
    UUID=7d98cda6-b9c3-43f9-811a-1f5c2bb2cc31 /registry-data xfs defaults 0 0

2. 找到对应 /registry-data 的那一行,检查其 UUID 是否与报错日志中的 7d98cda6... 一致,一致的话注释该条

复制代码
#UUID=7d98cda6-b9c3-43f9-811a-1f5c2bb2cc31  /registry-data          xfs     defaults             0 0

3. 保存推出后重启服务器,成功启动

复制代码
reboot

4. 总结

遇到 Linux 启动报错满屏红字时,请遵循以下原则:

  1. 不要只看最后几行: 最后的报错往往是前面错误导致的"受害者"。
  2. 寻找 "Timed out" 或 "Dependency": 向上翻阅日志,找到第一个失败的设备或服务。
  3. 关注磁盘挂载: 绝大多数进入 Emergency Mode 的情况,都是由 /etc/fstab 配置错误或磁盘故障引起的。
相关推荐
闲猫2 小时前
堡垒机Linux黑屏识别命令Set -n探索可能性
linux·运维·服务器
寺中人2 小时前
基于Linux实现SSH密钥免密登录完整实战教程(CentOS/Ubuntu通用)
linux·ssh·免密登录·服务器运维·ssh-keygen
lilihuigz2 小时前
从“拥有AEO工具”到“拥有AEO代理”:三层架构解决营销自动化瓶颈 - 易服客工作室
运维·自动化
有想法的py工程师2 小时前
手工处理 Oracle Cloud ARM 实例在线 DD Rocky Linux 10报错
linux·arm开发·oracle
万粉变现经纪人3 小时前
2026最新Windows11系统CMD安装Claude Code 快速接入DeepSeek V4 Pro在VSCode编程工具中使用保姆级入门教程指南
linux·运维·ide·windows·vscode·macos·编辑器
木雷坞3 小时前
自托管 n8n:Docker Compose、Webhook 和升级备份排查
运维·容器
少威shaowei3 小时前
在 Mac 上搭建 DNS 服务器
运维·服务器·macos
wxmtwfx3 小时前
Linux 系统内核列表宏解析
linux·list·列表
utf8mb4安全女神3 小时前
shell脚本
linux·运维·服务器