服务器数据恢复—raid5阵列离线硬盘强制上线失败如何恢复数据?

服务器数据恢复环境:

某品牌2850服务器上有一组由6块SCSI硬盘组建的raid5磁盘阵列,上层操作系统为Redhat linux+ext3文件系统。

服务器故障&初检:

服务器在运行过程中突然瘫痪,管理员对服务器中的raid进行检查后发现有两块硬盘离线。管理员对其中一块离线硬盘进行强制上线操作,但是强制上线操作完成后操作系统启动异常。管理员马上将服务器关机,联系我们数据恢复中心寻求帮助。

raid5阵列出现两块硬盘离线的故障情况非常普遍。raid5磁盘阵列支持一块硬盘离线时的冗余保护,一旦多块硬盘离线,磁盘阵列便处于瘫痪状态,且不会自动上线。

市面上绝大多数硬件厂商生产的raid控制器敏感性较强,多数硬盘掉线仅仅是因为电源波动、控制器bug等非硬盘硬件故障所导致,本案例中的情况就是如此。因为经过硬件工程师的初步检测,没有发现有硬盘存在物理故障。即使掉线硬盘不存在物理故障,如果此时进行强制上线的操作,风险还是很大的。一旦上线错误就会导致raid控制器对数据造成不可逆的破坏,进入操作系统后因为文件系统不一致会进行自动修复,进一步加大数据恢复的难度。

服务器数据恢复过程:

1、将服务器中所有硬盘以只读方式进行扇区级全盘镜像备份,在备份过程中发现有多块硬盘存在坏道但没有下线,应该是raid还没有读到硬盘坏道。备份完成后将所有磁盘按照原样还原到原服务器上。

2、基于镜像文件分析所有磁盘底层数据,获取故障raid组成结构信息。根据获取到的raid结构信息重组raid并进行结构验证。

3、北亚企安数据恢复工程师手工修正被破坏的结构,将修正后的数据导出到一台存储上临时存放。

4、使用完好的硬盘在服务器上搭建新的raid5磁盘阵列,将恢复出来的数据迁移到新搭建的raid中。

5、数据恢复工程师和用户方对服务器中的数据进行检测,发现一切正常。本次数据恢复工作结束。

服务器数据恢复结论:

一旦raid5磁盘阵列出现多块硬盘离线、服务器瘫痪的情况切记不要盲目进行强制上线的操作。尽可能将原硬盘全部做镜像,然后寻求专业数据恢复机构的帮助。

相关推荐
laugh123213 天前
GitLab 服务器宕机时的项目代码恢复方法
服务器·git·gitlab·数据恢复
CHS_Lab9 天前
特殊行车记录仪DAT视频丢失的恢复方法
数据恢复·行车记录仪恢复·视频恢复·mp4恢复·行车记录仪
文盲老顾9 天前
使用 fn_dblog手动恢复误操作的 update(单列数值型数据恢复)
数据库·sqlserver·数据恢复·update·误操作·fn_dblog
青云交14 天前
Java 大视界 -- 基于 Java 的大数据分布式存储系统的数据备份与恢复策略(139)
java·大数据·分布式·数据恢复·数据备份·分布式存储·并行处理
北亚数据恢复18 天前
虚拟化数据恢复—重装系统服务器崩了的数据恢复过程
数据恢复·服务器数据恢复·北亚数据恢复·虚拟化数据恢复
北亚数据恢复1 个月前
服务器数据恢复—raid5阵列中硬盘掉线导致上层应用不可用的数据恢复案例
数据恢复·服务器数据恢复·北亚数据恢复
北亚数据恢复1 个月前
服务器数据恢复—raid5阵列硬盘出现坏道导致上层应用崩溃的数据恢复案例
服务器·数据恢复·服务器数据恢复·北亚数据恢复
北亚数据恢复2 个月前
vsan数据恢复—vsan缓存盘故障导致虚拟磁盘文件丢失的数据恢复案例
数据恢复·服务器数据恢复·虚拟化数据恢复·vsan数据恢复
格桑阿sir2 个月前
Kubernetes控制平面组件:etcd高可用集群搭建
kubernetes·数据恢复·etcd·集群·数据备份·高可用·snapshot
Amd7942 个月前
数据库物理备份:保障数据完整性和业务连续性的关键策略
postgresql·数据恢复·数据库安全·备份策略·数据完整性·dba最佳实践·物理备份