服务器数据恢复环境:
P740+AIX+Sybase+V7000存储阵列柜,阵列柜上有12块SAS机械硬盘(包括1块热备盘)。
服务器故障:
管理员在日常巡检过程中发现阵列柜中有一块磁盘发生故障,于是更换磁盘并同步数据,数据同步还未进行到一半时,另一块磁盘也出现问题,导致小型机无法挂接逻辑盘,业务中断。存储管理界面显示有两块磁盘故障脱机,其中10号槽位故障盘为热备盘。
阵列柜中创建了2组Mdisk,加到一个pool中,现主要数据pool无法加载,共有三个通用卷无法挂载。
服务器数据恢复过程:
1、为防止数据分析和数据恢复过程中的误操作对原始磁盘数据造成二次破坏, 将存储中12块磁盘编号后全部取出。将完好的10块磁盘以只读方式做全盘镜像, 使用专业工具将2块故障磁盘处理后做镜像。镜像完成后将所有磁盘按照编号还原到原存储中,后续的数据分析和数据恢复操作都基于镜像文件进行。
2、针对本案例中的故障情况,北亚企安数据恢复工程师制定了2套数据恢复方案:
方案一、强制上线
1、分析故障存储中,故障硬盘的离线顺序。
2、修复后离线的故障硬盘。
3、将修复的硬盘插回存储,进行强制上线操作。
方案二、解析存储结构
1、分析及重组Mdisk
A、根据用户方提供的配置信息,将所有硬盘按照Mdisk组进行分类。
B、分析每一组Mdisk中的所有硬盘,获取raid相关信息。
C、利用获取到的raid相关信息虚拟重组Mdisk。
2、分析pool
A、分析所有Mdisk,获取到pool的相关信息。
B、解析pool在Mdisk上的分布情况。
3、分析LUN结构
A、分析pool中的条带大小。
B、解析LUN位图,分析各LUN在pool中的分布情况。
C、北亚企安数据恢复工程师编写程序提取LUN。
验证数据&移交数据:
数据提取完成后,用户方随机抽样检测提取出来的数据,没有发现问题。
用户方提供存储设备,在存储设备上创建与原环境一样大小和数量的LUN,将提取出的数据LUN的镜像文件,迁移到存储上创建的LUN中。
数据迁移后重新配置存储环境,再次验证,数据一切正常。本次服务器数据恢复工作完成。