服务器数据恢复环境&故障:
一台服务器中由20块硬盘组成一组raid,服务器上层部署的oracle数据库。
未知原因上层业务崩溃,管理员对服务器进行检查,发现导致服务器崩溃的原因是服务器上有3块硬盘离线。管理员将服务器内的所有硬盘按照编号后从槽位取出,将硬盘送到我们数据恢复中心要求恢复服务器中的oracle数据库数据。
服务器数据恢复过程:
1、接到故障服务器中的所有硬盘后,硬件工程师对故障服务器中的20块硬盘进行了硬件故障检测,结果发现所有硬盘均可正常识别,没有发现明显物理故障。
2、将故障服务器内的所有硬盘以只读方式进行扇区级全盘镜像,在镜像过程中发现故障服务器中离线的3个磁盘镜像速度异常,这三块磁盘内应该存在坏道或者不稳定扇区,这应该也是导致3块磁盘离线的原因。调整镜像策略跳过这3块磁盘的坏扇区继续做镜像,直至所有硬盘都成功镜像。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
3、所有硬盘都成功镜像后,服务器数据恢复工程师基于镜像文件进行底层数据分析,对ext3文件系统进行逆向分析获取到服务器内硬盘的盘序和校验信息,利用这些信息重组raid阵列。
4、通过和用户沟通后,提取出一些oracle的dmp文件,在导入dmp文件的过程中,oracle数据库报imp-0008错误。分析导入dmp文件的日志文件后,服务器数据恢复工程师发现恢复的dmp文件存在问题,所以dmp导入数据失败。
5、重新分析故障服务器中的raid结构,进一步确定ext3文件系统被破坏的程度。又经过数小时的分析,北亚企安数据恢复工程师重新提取dmp文件和dbf原始库文件,将提取出来的dmp文件交给用户进行数据导入的测试,经过测试一切顺利,没有发现问题。对提取的dbf原始库文件进行校验&检测,所有文件均能通过测试。
6、服务器数据恢复工程师联系用户方验证数据恢复结果。经过用户方的仔细验证,确认所有数据均已恢复。在服务器上又搭建了一组新的raid阵列,在数据恢复工程师的配合下,将所有恢复出来的数据迁移到服务器上。本次服务器数据恢复工作完成。