服务器存储数据恢复环境:
某单位一台某品牌DS5300存储,1个机头+4个扩展柜,50块硬盘组建2组RAID5磁盘阵列(一组raid5阵列有27块成员盘,存放Oracle数据库文件;另外一组raid5阵列有23块成员盘)。存储系统上层一共分了11个卷。
服务器存储故障:
磁盘故障导致27盘RAID5阵列崩溃,存储不可用,该存储设备已经过保。
服务器存储数据恢复过程:
1、将存储中故障raid5阵列中所有磁盘编号后从槽位上取出。硬件工程师对这27块硬盘做物理故障检测。经过检测发现其中2块硬盘存在坏道,SMART的错误冗余级别已经超过阈值。将25块正常硬盘以只读方式进行扇区级别的全盘镜像。针对2块存在坏道的硬盘使用专业工具处理&生成镜像文件。镜像完成后按照编号将磁盘还原到故障存储中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、基于镜像文件分析所有磁盘底层数据。收集DS5300存储日志信息并进行分析,分析两块指示灯亮黄灯的硬盘的掉线时间,找到数据较新的硬盘,用这块数据较新的磁盘来恢复。
3、经过北亚企安数据恢复工程师会诊,最终敲定以下数据恢复方案:
方案A:将存储中所有硬盘备份,然后通过该品牌自带的存储管理软件进行强制上线。
方案B:分析硬盘底层数据,重组RAID。然后从底层提取数据,重新加载oracle数据库,调试上层应用。
4、备份好存储中所有数据后,在模拟器上进行测试,然后按照方案A在存储上进行上线操作。通过该品牌存储管理软件进行强制上线,强制上线后raid处于降级状态。设置好热备盘上线开始同步数据,同步完成后发现上层的卷直接可以使用了,所有数据可见。上层应用可以直接启动,也能正常使用。
5、经过用户方仔细检测,确认恢复出来的数据完整有效,认可数据恢复结果。
6、将卷里的数据都拷贝出来移交给用户方。本次数据恢复工作结束。