Linux线上服务器掉电后无法启动故障的分析与修复实践——及其隐患解决(标准分区扩容、逻辑分区缩容与扩容)

一、RockyLinux9****掉电后无法启动

这里是RockyLinux9的线上服务器掉电后重新启动无法正常进入系统的故障,会显示很多类似"[FAILED] Failed to start D-Bus System Message Bus.

See 'systemctl' status dbus-broker.service for details.

Starting D-Bus System Message Bus...

FAILED\] Failed to start GNOME Display Manager. See 'systemctl status gdm.service' for details. "的错误信息,如下图所示: ![](https://i-blog.csdnimg.cn/direct/fd91491f28fa4d2eb108a31c5e47a5e1.png) ## 二、思路分析 ### 2.1、系统无法正常启动的常规思路 一般来说,系统无法正常启动,我们都可以使用该系统的iso镜像文件通过系统启动U盘或PXE引导进入【系统救援模式】中来分析查看具体的错误详情。进入系统救援模式的步骤: 《1》主机上电后不停按下F2键选择系统启动U盘或PXE启动进入引导菜单后选择【Troubleshooting】后按下Enter键--\>【Rescue a Rocky Linux system】后按下Enter键--\>输入【1】后按下Enter键以读写模式进入系统救援模式,可以看到错误信息"dasbus.error.DBusError: \[Errno 28\] No space left on device: '/proc/self/mounts'-\>'/mnt/sysimage/etc/mtab'"(即:设备没有空间,内容没法写入和操作,因为没有存储空间导致系统不能正常启动进入的,只有一种情况就是根分区的空间满了,其他分区的空间满了对于系统启动没有什么影响;既然现在以读写模式进入系统救援模式后无法操作,那我们就以只读模式进入系统救援模式在操作看看)。 《2》重启主机后一样的操作不停按下F2键选择系统启动U盘或PXE启动进入引导菜单后选择【Troubleshooting】后按下Enter键--\>【Rescue a Rocky Linux system】后按下Enter键--\>在系统界面输入【2】后以只读模式进入系统救援模式(模式是两套系统【救援模式的系统类似windows pe】【本主机的原有系统被挂载到 /mnt/sysroot 目录下】;若想要将原系统如正常启动的系统一样的挂载使用则运行 chroot /mnt/sysroot 命令即可);执行【df -hT】可以查看系统当前的所有内容挂载情况(可以看到该主机的原系统根分区使用是100%)。 ![](https://i-blog.csdnimg.cn/direct/20a8136e9de041b8b38b90df210023f7.png) ![](https://i-blog.csdnimg.cn/direct/eec50814cd574c5cafa911009ec7e91c.png) ![](https://i-blog.csdnimg.cn/direct/15326bff67c849789fcf3781351d86e9.png) ![](https://i-blog.csdnimg.cn/direct/4b0e7c3edc29424e885b9dba78d36915.png) ![](https://i-blog.csdnimg.cn/direct/84cac577ae96403dad45a24849266b5f.png) ![](https://i-blog.csdnimg.cn/direct/03caccdcb4c54f938379c5dceb70d22f.png) ### 2.2、系统故障分析确认 在系统救援模式下,使用【chroot /mnt/sysroot】命令切换到该主机系统上后,可以运行【df -hT】先查看所有分区的挂载与使用情况,可以看到当前系统的根分区使用率已经到达100%,与我们最开始预测的根分区满了的推测一致;接下来的操作就是排查根分区中哪个内容是占用空间较大且可以删除的即可解决问题: ![](https://i-blog.csdnimg.cn/direct/369fc8a607cd41feb2665160792f039b.png) ### 2.3、修复故障 排查根分区中哪个内容是占用空间较大且可以删除的: 《1》先查看根分区中占用空间的情况命令是【du -sh ./\*】; 《2》进入这个占用空间较大的目录(如/mnt)中继续执行查看占用空间情况命令【du -sh ./\*】(排查到时swapfile1文件占用空间最大到达15G,且这个文件是用作物理内存不够交换使用的,分的太大了,可以直接删除,但目前是只读文件系统,无法删除文件); 《3》既然当前有问题的根分区是以只读模式挂载的,那么修改为读写模式挂载【mount -o remount,rw /】后再执行文件删除操作即可,然后再次查看系统的所有挂载分区使用情况【df -hT】可以看到根分区已经空闲出15G空间出来使用正常了。 《4》退出当前模式【exit】并重启系统【reboot -f】查看系统是否可以启动后正常进入系统使用。 ![](https://i-blog.csdnimg.cn/direct/b369d84035c7491e94d7ba43b52cbadd.png) ![](https://i-blog.csdnimg.cn/direct/94ebc16118454f1799beae15766f6a72.png) ![](https://i-blog.csdnimg.cn/direct/61bfdd6b2f8c46eeaf625c55475808d8.png) ![](https://i-blog.csdnimg.cn/direct/4a23c2d3109f44db8f3f92586692da87.png) ![](https://i-blog.csdnimg.cn/direct/23b523498ba7450da84e37b0541d347f.png) ![](https://i-blog.csdnimg.cn/direct/7904327d9cd9440f83ac497b964c4562.png) ![](https://i-blog.csdnimg.cn/direct/e061a079727548ddb0bf9da4214c7666.png) **到这里恭喜你,故障修复完成,可以成功进入系统中了。** ## 三、隐患解决 ### 3.1、系统隐患问题 虽然目前已经将根分区满的问题暂时解决了,但目前系统的根分区是不合理的(并没有将【/var】【/log】独立出来,都是糅合在根分区上)且目前根分区只有20GB,空间容量也不大,在后续的使用过程中还是会存在根分区空间又满的情况。 ### 3.2、逻辑卷LVM分区的缩容与扩容 [Linux的磁盘存储管理实操------(下一)------标准分区扩容![](https://csdnimg.cn/release/blog_editor_html/release2.4.4/ckeditor/plugins/CsdnLink/icons/icon-default.png)https://coffeemilk.blog.csdn.net/article/details/149533061](https://coffeemilk.blog.csdn.net/article/details/149533061 "Linux的磁盘存储管理实操——(下一)——标准分区扩容")[Linux的磁盘存储管理实操------(下二)------逻辑卷管理LVM的扩容、缩容![](https://csdnimg.cn/release/blog_editor_html/release2.4.4/ckeditor/plugins/CsdnLink/icons/icon-default.png)https://coffeemilk.blog.csdn.net/article/details/149632228](https://coffeemilk.blog.csdn.net/article/details/149632228 "Linux的磁盘存储管理实操——(下二)——逻辑卷管理LVM的扩容、缩容") 查看该主机当前的分区情况(可以看到/home的空间容量较大,剩余空间很多),在没有新增硬盘的基础上实现对根分区的扩容。 《1》LVM且文件系统格式为xfs只能在线扩容,不能缩容; 《2》LVM且文件系统格式为ext4则可以在线缩容和扩容。 而这里的/home分区是xfs格式的,就只能先将该分区的数据备份,然后卸载,接着格式化后操作了。 [Linux系统的常用操作命令------文件远程传输、文件编辑、软件安装的四种方式![](https://csdnimg.cn/release/blog_editor_html/release2.4.4/ckeditor/plugins/CsdnLink/icons/icon-default.png)https://blog.csdn.net/xiaochenXIHUA/article/details/149136931](https://blog.csdn.net/xiaochenXIHUA/article/details/149136931 "Linux系统的常用操作命令——文件远程传输、文件编辑、软件安装的四种方式") [Linux中rsync数据镜像工具的解析与应用实战![](https://csdnimg.cn/release/blog_editor_html/release2.4.4/ckeditor/plugins/CsdnLink/icons/icon-default.png)https://coffeemilk.blog.csdn.net/article/details/150115015](https://coffeemilk.blog.csdn.net/article/details/150115015 "Linux中rsync数据镜像工具的解析与应用实战")[Linux的压缩与解压缩![](https://csdnimg.cn/release/blog_editor_html/release2.4.4/ckeditor/plugins/CsdnLink/icons/icon-default.png)https://coffeemilk.blog.csdn.net/article/details/149109326](https://coffeemilk.blog.csdn.net/article/details/149109326 "Linux的压缩与解压缩")[syncthing的配置使用![](https://csdnimg.cn/release/blog_editor_html/release2.4.4/ckeditor/plugins/CsdnLink/icons/icon-default.png)https://blog.csdn.net/xiaochenXIHUA/article/details/155027993](https://blog.csdn.net/xiaochenXIHUA/article/details/155027993 "syncthing的配置使用")[国产统信UOS专业版桌面、服务器系统的安装部署、备份与还原实践保姆级教程![](https://csdnimg.cn/release/blog_editor_html/release2.4.4/ckeditor/plugins/CsdnLink/icons/icon-default.png)https://coffeemilk.blog.csdn.net/article/details/155530808](https://coffeemilk.blog.csdn.net/article/details/155530808 "国产统信UOS专业版桌面、服务器系统的安装部署、备份与还原实践保姆级教程") ```bash #对LVM(逻辑卷管理)的/home分区进行缩容操作;并对LVM管理的根分区扩容 df -hT vgdisplay #1-先对需要缩容的/home分区的数据备份(可使用scp、rsync、syncthing、再生龙等工具操作) #2-卸载/home分区(若在卸载分区时提示"目标忙",则是因为被一些进程或用户占用,查询到这些进程后强制杀死后再次卸载) umount /home #2.1-查看占用该分区的所属用户、进程PID、权限和对应命令 fuser -mv /home #2.2-查看所有打开该分区内文件的进程 lsof +D /home #2.3-强制杀死获取到的占用PID kill -9 2648 #2.4-【懒卸载】在分区不再繁忙时自动完成卸载,对数据的风险相对较低 umount -l /home #2.5-【强卸载】强制中断所有占用连接完成卸载,适用于部分网络文件系统,风险较高,非必要不使用 umount -f /home #3-扩容根分区(如:给逻辑卷根分区新增30G)后查看容量(容量扩容后需要刷新后才会显示【ext4使用resize2fs命令】【xfs使用xfs_growfs命令】) vgdisplay lvextend -L +30G /dev/mapper/rl-root df -hT xfs_growfs /dev/mapper/rl-root df -hT #4-将剩余的逻辑卷内容给home分区 vgdisplay lvcreate -n home -l 10239 rl lvdisplay mkfs.ext4 /dev/rl-home #4.1-挂载/home分区(若挂载时提示"文件系统类型错误、选项错误/dev/mapper/rl-home 上有坏超级块、缺少代码页或帮助程序或其他错误"则需要编辑【/etc/fstab】文件查看/home分区已经得内容文件类型是否正确,修改正确后重新挂载) mount /home df -hT #5-若运行了一段时间发现根分区又不够使用了,此时需要将/home的容量给到根分区 #5.1-先卸载/home分区 umount /home #5.2-对/home分区缩容 e2fsck -f /dev/mapper/rl-home resize2fs /dev/mapper/rl-home 20G #5.3-对于/home对应的逻辑卷是否缩容成功,可执行vgdisplay命令查看 vgdisplay #5.3-让缩容的/home对应逻辑卷生效 lvreduce -L 20G /dev/mapper/rl-home mount /home df -hT #5.4-给根分区扩容 lvextend -L +20G /dev/mapper/rl-root xfs_growfs /dev/mapper/rl-root df -hT ``` ![](https://i-blog.csdnimg.cn/direct/cdf6b7accb8e4ca6a80efcbc5b7434b0.png) ![](https://i-blog.csdnimg.cn/direct/c52d424fdacf4b8ab8a9c173bce6e9db.png) ![](https://i-blog.csdnimg.cn/direct/b78620abed2a459abb219e26a27606ac.png) ![](https://i-blog.csdnimg.cn/direct/ab10a0126fe14c02a2f18c9fda6dd250.png) ![](https://i-blog.csdnimg.cn/direct/ad34cbfebdf64ed9a5190cd315d63b9b.png) ![](https://i-blog.csdnimg.cn/direct/34718edb13934e2fa622878d7a33d72b.png) ![](https://i-blog.csdnimg.cn/direct/a42f88d4568649be95f26d87c87d1789.png) ![](https://i-blog.csdnimg.cn/direct/2619e487c6fa4b3f89decb9159467c37.png) ![](https://i-blog.csdnimg.cn/direct/8f33fca29ac9498295a0727d8e2c9ce5.png) ![](https://i-blog.csdnimg.cn/direct/c85db3fcaadb455aa9811339e48d6f77.png) ![](https://i-blog.csdnimg.cn/direct/5d5217f881a54176a8e086cbf4593dba.png) ![](https://i-blog.csdnimg.cn/direct/ee96267ee08d4e21a4c73ffe3377cf82.png) ![](https://i-blog.csdnimg.cn/direct/e6d23816b12c4aa2a826e6a84089579d.png) ![](https://i-blog.csdnimg.cn/direct/d656771fe26b43ce97c192926c782cbf.png) ![](https://i-blog.csdnimg.cn/direct/a4657af0cf6b49ed9e52da6c16554844.png) ![](https://i-blog.csdnimg.cn/direct/560b9bd3de344e05b34ca7c66a05b854.png) ### 3.3、标准分区的扩容 **标准分区扩容要求本块磁盘还有剩余空间,同时仅有最后一个磁盘分区能够使用本磁盘剩余的空间。** 现有一块/dev/sdb磁盘共有30G的空间,目前已经分配给/dev/sdb1的空间是10G还剩余20G没有使用,现在需要将这些剩余的空间都分配给/dev/sdb1使用。 ```bash #现有的/dev/sdb磁盘共有30G;/dev/sdb1分配了10G,现在需要对/dev/sdb1分区扩容使用剩下的所有空间【且标准分区的扩容对被扩容的分区数据不会丢失】 #1-卸载需扩容的分区 umount /data #2-对磁盘扩容 fdisk /dev/sdb p d p n N p w #3-让磁盘的扩容生效(ext4文件系统使用【resize2fs】命令;xfs文件系统使用【xfs_growfs】) resize2fs /dev/sdb1 #4-挂载分区 mount /dev/sdb1 /data ``` ![](https://i-blog.csdnimg.cn/direct/9ede051e36b74dac8eca9fdd23859bd8.png) ![](https://i-blog.csdnimg.cn/direct/6051942799064db483029ff3cb00bd0c.png) ![](https://i-blog.csdnimg.cn/direct/d71a279d55c3427a8d952d8bf6a4ff5a.png) ![](https://i-blog.csdnimg.cn/direct/148cff9aefea4d15b48066d2cfb90703.png) ![](https://i-blog.csdnimg.cn/direct/7c4c6d9e4f414b9e836f808deefd5318.png) ![](https://i-blog.csdnimg.cn/direct/da04da4655e348988a0972636f9faa36.png) ![](https://i-blog.csdnimg.cn/direct/37ffdab95d7f47c2bfcab63e1252f24e.png) ### 3.4、Linux中标准分区、逻辑卷管理的缩容、扩容 #### 3.4.1、标准分区扩容 **标准分区扩容必须条件:**本块磁盘还有剩余空间,同时仅有最后一个磁盘分区能够使用本磁盘剩余的空间【在标准分区扩容的整个过程中,磁盘原有数据不会丢失】。 ```bash #标准分区的扩容操作 #1-卸载分区 umount /dev/sdb #2-磁盘扩容操作(先删除原有分区,然后在创建新分区【注意:提示是否移除标签时一定要选择否,才会保留被扩容分区的原始数据】) fdisk /dev/sdb p d n N w #3-让的磁盘扩容生效 resize2fs /dev/sdb1 #4-挂载分区到指定分区 mount /dev/sdb1 /data ``` #### 3.4.2、逻辑卷管理的缩容扩容 ![](https://i-blog.csdnimg.cn/direct/acec103fc8804e62a1d98de55d05084d.png) ```bash #创建物理卷并加入卷组,并创建逻辑卷 #1-创建物理卷并加入卷组 #1.1-创建物理卷 pvcreate /dev/sdb /dev/sdc #1.2-将硬盘将入卷组【storage】 vgcreate storage /dev/sdb /dev/sdc #1.3-查看卷组状态 vgdisplay #2-创建逻辑卷 #2.1-创建一个名为 vo、大小为 37x4MB 的逻辑卷,用于存储数据 lvcreate -n vo -l 37 storage #2.2-查看逻辑卷是否创建成功 lvdisplay #2.3-格式化逻辑卷 mkfs.ext4 /dev/storage/vo #2.4-创建挂载点,然后挂载 mkdir /vo mount /dev/storage/vo /vo ``` ```bash #扩容逻辑卷 #1-ext4文件系统 umount /vo lvextend -L 360M /dev/storage/vo e2fsck -f /dev/storage/vo resize2fs /dev/storage/vo mount -a df -hT #2-xfs文件系统 lvextend -L 360M /dev/storage/vo xfs_growfs /dev/mapper/storage-vol2 ``` ```bash #缩容逻辑卷 #1-ext4文件系统 umount /vo e2fsck -f /dev/storage/vo resize2fs /dev/storage/vo 160M lvreduce -L 160M /dev/storage/vo mount -a df --h #2-Xfs文件系统 xfs文件系统创建后,其大小不能缩小。但是,仍然可以使用 xfs_growfs 命令放大 ``` ```bash #逻辑卷管理的删除操作 #1-先卸载分区 umount /vo #2-删除逻辑卷,需要输入y确认操作 lvremove /dev/storage/vo #3-删除卷组,只需要写卷组名称即可,不需要设备的绝对路径 vgremove storage vi /etc/fstab移除对应逻辑卷 #4-删除物理卷 pvremove /dev/sdb /dev/sdc ```

相关推荐
wniuniu_1 小时前
ceph中的rbd的稀疏写入
java·服务器·数据库
为什么不问问神奇的海螺呢丶2 小时前
SFTP搭建-自动检测上传文件修改权限-rsync 自动同步到其他服务器
运维·服务器
沉醉不知处2 小时前
远程连接虚拟机,设置网络后,ip不变
服务器·网络·tcp/ip
咕噜签名-铁蛋2 小时前
云服务器高速网络架构设计与实践
服务器
咕噜企业分发小米2 小时前
阿里云与华为云在基因测序数据存储上哪个更好?
服务器·阿里云·腾讯云
wanhengidc2 小时前
巨 椰 云手机 性能稳定
运维·服务器·arm开发·智能手机·云计算
爱尔兰极光2 小时前
计算机网络--数据链路层
服务器·网络·计算机网络
巴拉巴拉~~2 小时前
KMP 算法通用步进器组件:KmpStepperWidget 横向 / 纵向 + 匹配进度 + 全样式自定义
java·服务器·开发语言
翼龙云_cloud2 小时前
阿里云渠道商:阿里云GPU怎么搭建部署个人作品集博客?
运维·服务器·阿里云·云计算