Oracle UNDO表空间文件误删除故障恢复

Oracle UNDO表空间文件误删除故障恢复

本篇针对Oracle数据库UNDO表空间数据文件误删除后的两类典型故障场景


故障场景一:数据库未关闭,执行shutdown immediate报错

故障现象

UNDO表空间文件误删除后,数据库仍处于运行状态,执行正常关闭命令触发文件打开失败报错,核心报错信息如下:

Plain 复制代码
SQL> shutdown immediate;
ORA-01116: error in opening database file 3
ORA-01110: data file 3: '/u01/app/oracle/oradata/orcl/datafile/undotbs1.258.1218675403'
ORA-27041: unable to open file
Linux-x86_64 Error: 2: No such file or directory

恢复前提

数据库进程未终止,系统仍保留误删除文件的进程句柄,可通过进程fd目录找回文件。

实际操作命令

  1. 查找误删除文件的进程句柄
    执行命令筛选已删除的UNDO文件关联进程,精准定位文件描述符编号与对应进程PID,为后续文件还原做准备。
  • 通用查询:筛选所有已删除文件关联进程

    lsof | grep deleted

  • 精准查询:直接定位目标误删UNDO文件

    lsof | grep undotbs1.258.1218675403

  1. 进入对应进程文件描述符目录
    将命令中的PID替换为上一步查询到的数据库进程号,查看目录下文件描述符详情。

    cd /proc/13412/fd
    ll

  1. 复制句柄文件还原至原路径
    替换命令中的文件描述符编号和UNDO文件原路径。
shell 复制代码
cp 257 /u01/app/oracle/oradata/orcl/datafile/undotbs1.258.1218675403
  1. 正常关闭并启动数据库,完成文件恢复
    文件还原后,执行数据库关闭、启动及数据文件恢复命令,最终正常打开数据库。

    shutdown immediate;

启动数据库至mount状态

复制代码
startup mount;

恢复指定UNDO数据文件

复制代码
recover datafile 3;

正常打开数据库

复制代码
alter database open;

故障场景二:文件误删除后,数据库正常关闭无报错,重启后开库失败

故障现象

UNDO文件误删除后,数据库正常关闭未触发报错,重启后ALTER日志报错,启动数据库提示无法识别锁定数据文件,核心报错:

Plain 复制代码
ORA-01157: cannot identify/lock data file 3 - see DBWR trace file
ORA-01110: data file 3: '/u01/app/oracle/oradata/orcl/datafile/undotbs1.258.1218675403'

实际操作命令

  • 尝试切换UNDO管理模式为手动

    alter system set undo_management=MANUAL SCOPE=SPFILE;

  • 将undotbs1.258.1218675403下线后重启

    alter database datafile '/u01/app/oracle/oradata/orcl/datafile/undotbs1.258.1218675403' offline;
    shutdown immediate;
    startup;

  • 设置UNDO为新的UNDO 并且将控制文件中的表空间信息删除

    create undo tablespace undotbs3 DATAFILE '/u01/app/oracle/oradata/orcl/datafile/undotbs3.dbf' size 70M ;

    alter system set undo_tablespace='undotbs3' SCOPE=SPFILE;

  • 重启数据库

    startup;

  • 删除表空间文件

    DROP TABLESPACE UNDOTBS1 INCLUDING CONTENTS AND DATAFILES CASCADE CONSTRAINTS;


实践附加故障及解决方案

故障1:文件一致性恢复报错

报错信息

复制代码
ORA-01194: file 1 needs more recovery to be consistent
ORA-01110: data file 1: /u01/app/oracle/oradata/orcl/datafile/system.256.1218675401

解决步骤

  1. 设置隐含参数,允许重置日志修复数据文件一致性损坏,修改参数至spfile文件。

    alter system set _allow_resetlogs_corruption= TRUE SCOPE=SPFILE;

  2. 重启数据库,重新执行不完全恢复及resetlogs开库操作,完成修复。

    shutdown;
    immediate;
    startup mount;
    recover database using backup controlfile until cancel;
    ALTER DATABASE OPEN RESETLOGS;

故障2:数据字典缺失系统表空间文件报错

报错信息

复制代码
ORA-01173: data dictionary indicates missing data file from system tablespace

解决步骤

  1. 提取系统数据文件中的回滚段信息,导出至临时日志文件,方便后续整理。

    strings /u01/app/oracle/oradata/orcl/datafile/system.256.1218675401 |grep _SYSSMU /tmp/systemSMU.log

  2. 整理导出的日志文件,对回滚段名称去重,剔除格式异常、无效的条目,保留标准_SYSSMU开头的回滚段名称。

  3. 修改数据库参数文件pfile,添加手动UNDO管理参数,同时配置损坏回滚段屏蔽参数,将整理后的所有有效回滚段填入参数内。

    *.undo_management=manual;

    *._CORRUPTED_ROLLBACK_SEGMENTS=(_SYSSMU4_1254879796,_SYSSMU3_1723003836,其余去重后回滚段名称)

  4. 使用修改后的pfile手动启动数据库,重新执行控制文件重建、不完全恢复流程,完成最终修复。

    startup pfile=/u01/app/oracle/product/11g/db/dbs/initorcl.ora;
    nomount;

后续重复执行控制文件重建、恢复、开库步骤


相关推荐
2301_776508722 小时前
用Python生成艺术:分形与算法绘图
jvm·数据库·python
cxr8282 小时前
PaperclipAI 组织关系与智能体协作指南
数据库·人工智能·架构·ai智能体·openclaw
@insist1233 小时前
数据库系统工程师-Armstrong 公理系统:函数依赖推理与候选码求解核心方法论(重点)
数据库·软考·软件设计师·软件水平考试
山峰哥3 小时前
查询优化案例:从慢查询到闪电般的查询速度
数据库·sql·性能优化·编辑器·深度优先
杨云龙UP3 小时前
Oracle ASM磁盘组空间分配与冗余理解
linux·运维·数据库·sql·oracle
微学AI4 小时前
一款数据库SQL防火墙:可以拦截99.99%,可以阻止恶意SQL
数据库·sql
2401_884563244 小时前
Python Lambda(匿名函数):简洁之道
jvm·数据库·python
haixingtianxinghai5 小时前
Redis真的是单线程吗?
数据库·redis·缓存
FirstFrost --sy5 小时前
MySQL复合查询
数据库·mysql