Oracle UNDO表空间文件误删除故障恢复
本篇针对Oracle数据库UNDO表空间数据文件误删除后的两类典型故障场景
故障场景一:数据库未关闭,执行shutdown immediate报错
故障现象
UNDO表空间文件误删除后,数据库仍处于运行状态,执行正常关闭命令触发文件打开失败报错,核心报错信息如下:
Plain
SQL> shutdown immediate;
ORA-01116: error in opening database file 3
ORA-01110: data file 3: '/u01/app/oracle/oradata/orcl/datafile/undotbs1.258.1218675403'
ORA-27041: unable to open file
Linux-x86_64 Error: 2: No such file or directory

恢复前提
数据库进程未终止,系统仍保留误删除文件的进程句柄,可通过进程fd目录找回文件。
实际操作命令
- 查找误删除文件的进程句柄
执行命令筛选已删除的UNDO文件关联进程,精准定位文件描述符编号与对应进程PID,为后续文件还原做准备。
-
通用查询:筛选所有已删除文件关联进程
lsof | grep deleted
-
精准查询:直接定位目标误删UNDO文件
lsof | grep undotbs1.258.1218675403

-
进入对应进程文件描述符目录
将命令中的PID替换为上一步查询到的数据库进程号,查看目录下文件描述符详情。cd /proc/13412/fd
ll

- 复制句柄文件还原至原路径
替换命令中的文件描述符编号和UNDO文件原路径。
shell
cp 257 /u01/app/oracle/oradata/orcl/datafile/undotbs1.258.1218675403
-
正常关闭并启动数据库,完成文件恢复
文件还原后,执行数据库关闭、启动及数据文件恢复命令,最终正常打开数据库。shutdown immediate;
启动数据库至mount状态
startup mount;
恢复指定UNDO数据文件
recover datafile 3;
正常打开数据库
alter database open;
故障场景二:文件误删除后,数据库正常关闭无报错,重启后开库失败
故障现象
UNDO文件误删除后,数据库正常关闭未触发报错,重启后ALTER日志报错,启动数据库提示无法识别锁定数据文件,核心报错:
Plain
ORA-01157: cannot identify/lock data file 3 - see DBWR trace file
ORA-01110: data file 3: '/u01/app/oracle/oradata/orcl/datafile/undotbs1.258.1218675403'
实际操作命令

-
尝试切换UNDO管理模式为手动
alter system set undo_management=MANUAL SCOPE=SPFILE;
-
将undotbs1.258.1218675403下线后重启
alter database datafile '/u01/app/oracle/oradata/orcl/datafile/undotbs1.258.1218675403' offline;
shutdown immediate;
startup; -
设置UNDO为新的UNDO 并且将控制文件中的表空间信息删除
create undo tablespace undotbs3 DATAFILE '/u01/app/oracle/oradata/orcl/datafile/undotbs3.dbf' size 70M ;
alter system set undo_tablespace='undotbs3' SCOPE=SPFILE;
-
重启数据库
startup;
-
删除表空间文件
DROP TABLESPACE UNDOTBS1 INCLUDING CONTENTS AND DATAFILES CASCADE CONSTRAINTS;
实践附加故障及解决方案
故障1:文件一致性恢复报错
报错信息
ORA-01194: file 1 needs more recovery to be consistent
ORA-01110: data file 1: /u01/app/oracle/oradata/orcl/datafile/system.256.1218675401
解决步骤
-
设置隐含参数,允许重置日志修复数据文件一致性损坏,修改参数至spfile文件。
alter system set _allow_resetlogs_corruption= TRUE SCOPE=SPFILE;
-
重启数据库,重新执行不完全恢复及resetlogs开库操作,完成修复。
shutdown;
immediate;
startup mount;
recover database using backup controlfile until cancel;
ALTER DATABASE OPEN RESETLOGS;
故障2:数据字典缺失系统表空间文件报错
报错信息
ORA-01173: data dictionary indicates missing data file from system tablespace
解决步骤
-
提取系统数据文件中的回滚段信息,导出至临时日志文件,方便后续整理。
strings /u01/app/oracle/oradata/orcl/datafile/system.256.1218675401 |grep _SYSSMU /tmp/systemSMU.log
-
整理导出的日志文件,对回滚段名称去重,剔除格式异常、无效的条目,保留标准_SYSSMU开头的回滚段名称。
-
修改数据库参数文件pfile,添加手动UNDO管理参数,同时配置损坏回滚段屏蔽参数,将整理后的所有有效回滚段填入参数内。
*.undo_management=manual;
*._CORRUPTED_ROLLBACK_SEGMENTS=(_SYSSMU4_1254879796,_SYSSMU3_1723003836,其余去重后回滚段名称)
-
使用修改后的pfile手动启动数据库,重新执行控制文件重建、不完全恢复流程,完成最终修复。
startup pfile=/u01/app/oracle/product/11g/db/dbs/initorcl.ora;
nomount;
后续重复执行控制文件重建、恢复、开库步骤