服务器数据恢复环境:
一台服务器中有两组分别由4块SAS硬盘组建的raid5阵列,两组阵列上层划分LUN组建LVM结构,并被格式化为EXT3文件系统。
服务器故障&检测:
RIAD5阵列中有一块硬盘故障离线,热备盘激活上线顶替离线硬盘。在热备盘上线同步数据的过程中,该RAID5阵列中又有一块硬盘离线,热备盘同步失败,该组RAID5阵列崩溃,上层的LVM结构被破坏,EXT3文件系统无法正常使用。
硬件工程师对两块离线硬盘进行硬件故障检测,发现先离线的那块硬盘无法识别,应该是硬件问题,需要开盘修复。后离线的硬盘可以正常识别。
服务器数据恢复过程:
1、将故障服务器中故障RAID中所有磁盘编号后取出,经过硬件工程师的检测发现,发现先离线的磁盘无法识别。硬件工程师对这块硬盘进行了开盘操作。开盘后发现盘片磨损严重,无法修复,只能对故障RAID5阵列进行缺盘处理。
2、以只读方式将故障RAID5阵列中的其余成员盘进行全盘镜像备份,并且对另一组完好的raid5阵列中的全部磁盘进行全盘备份。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
3、基于镜像文件分析硬盘底层数据,通过解析EXT3文件系统结构,分析出两组raid5阵列的盘序、条带大小、校验方向等RAID结构相关信息。经过分析,两组raid阵列块大小都为64K,校验方向为左同步,对故障raid进行重组时进行缺盘处理。根据分析出的RAID结构相关信息重组两组raid5阵列。
4、重组出两组raid阵列后分析两组raid中的底层数据,找出LVM结构信息。对LVM结构进行分析,将两组raid中作为PV(LVM物理卷)的LUN导出,然后将两个PV重组,重新生成LVM逻辑卷。
5、LVM重组之后,解析LV(逻辑卷)中的EXT3文件系统,恢复并导出其中的全部数据。
6、用户方工程师对恢复出来的数据进行检测后,确认恢复出来的数据完整有效。本次数据恢复工作完成。