服务器数据恢复环境:
某单位一台服务器上有一组raid5阵列,该raid5阵列有15块成员盘。上层是一个xfs裸分区,起始位置是0扇区。
服务器故障&检测:
服务器raid5阵列中有硬盘性能表现不稳定,但是由于管理员长时间没有关注服务器的运行状态,没有及时发现这个问题,终于有磁盘出现故障掉线。raid5阵列上的热备盘替换掉线硬盘,在上线同步数据的过程中又有其他硬盘掉线,数据同步过程中断,raid5阵列崩溃,导致服务器数据丢失。
北亚企安数据恢复工程师将故障服务器中所有磁盘编号后取出,由硬件工程师对每块磁盘进行硬件故障检测,发现先离线的硬盘中存在大量的坏道,后掉线的硬盘中也存在少量坏道。没有掉线的其他硬盘均没有发现物理故障。
这是一个典型的raid5阵列热备盘在同步数据过程中出现其他硬盘掉线,从而导致raid阵列崩溃的案例。针对这种情况,最便捷的恢复服务器数据的方法就是修复后掉线的那块硬盘的物理故障,将后掉线的这块硬盘内的数据恢复出来,然后重组raid阵列即可恢复服务器的数据。
服务器数据恢复过程:
1、将故障服务器中其他无物理故障的磁盘以只读方式做扇区级别的全盘镜像备份,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
将后掉线的那块硬盘使用专业工具处理后进行了备份,由于这块硬盘中存在着坏扇区,部分数据无法读取,北亚企安数据恢复工程师手动查看底层数据并根据异或规律计算坏扇区位置的数据并手动写入。
2、基于镜像文件分析底层数据获取raid5结构相关信息,根据获取到的信息虚拟重组riad并验证riad5结构的正确性。
3、利用镜像好的后掉线的硬盘进行数据同步。
4、数据同步结束后由工程师验数据的正确性,验证无误后交由用户方工程师验证。经过用户方工程师的反复验证,确认恢复出来的数据目录结构完整,数据可用,程序无报错且运行正常。本次数据恢复工作完成。
服务器数据安全Tips:
Raid5磁盘阵列的安全性相对较高,但依然会出现数据丢失的情况。只有定期维护,及时检修,更换老旧、不稳定的硬盘,才能尽可能的避免发生数据灾难。