【Oracle篇】Oracle数据库坏块处理:rman修复坏块实践与案例分析(第七篇,总共八篇)

💫《博主介绍》:****✨又是一天没白过,我是奈斯,DBA一名✨

💫《擅长领域》:****✌️擅长Oracle、MySQL、SQLserver、阿里云AnalyticDB for MySQL(分布式数据仓库)、Linux,也在扩展大数据方向的知识面✌️

💖💖💖大佬们都喜欢静静的看文章,并且也会默默的点赞收藏加关注💖💖💖

今天这篇文章作为Oracle rman系列的倒数第二篇,那么如标题所示给大家介绍一下怎么通过rman备份修复坏块的问题,那么大家都知道 rman是物理备份工具,可以通过备份的文件对存在的坏块进行修复。那么带着修复坏块的问题,进入今天的内容吧!!!

然而,RMAN所涉及的内容之广、之深,使得难以在单篇文章中全面涵盖。所以我将理论、命令、备份策略、异机恢复、坏块处理等分成八篇文章去讲,即使分为八篇也有不少内容没有涵盖到,所以这八篇文章都是精华,看完这八篇就可以解决95%以上的RMAN相关工作内容了。八篇文章的内容分别如下:

  • 第一篇:rman物理备份工具的基础理论概述
  • 第二篇:rman工具实用指南:常用命令详解与实践
  • 第三篇:rman标准化全库备份策略:完整备份or增量备份
  • 第四篇:rman全库异机恢复:从RAC环境到单机测试环境的转移
  • 第五篇:rman全库异机恢复:从单机环境到RAC测试环境的转移
  • 第六篇:rman时间点异机恢复:从RAC环境到单机测试环境的转移
  • 第七篇:Oracle数据库坏块处理:rman修复坏块实践与案例分析**(当前篇)**
  • 第八篇:逻辑备份工具expdp(exp)/impdp(imp)和物理备份工具rman的区别和各自的使用场景总汇

坏块分为两种:

  • **物理坏块:**指的是由于介质损坏或存储层面的问题导致的块损坏,例如磁盘故障或数据损坏。BLOCKRECOVER命令可以用来修复这种类型的损坏,它会尝试从备份中恢复受损的数据块,或者使用磁盘上的镜像数据进行修复。
  • **逻辑坏块:**则是由数据库逻辑结构的问题引起的块损坏,例如数据完整性约束问题或逻辑错误导致的块损坏。对于逻辑坏块,通常需要通过其他手段来修复,比如恢复到一个之前的时间点或者执行逻辑数据修复操作。

验证是否有坏块的办法:

|--------------|----------------|----------------|------------------------------------------------------------------------------------|
| 工具列表 | 坏块检查类型 | 能否修复坏块 | 描述 |
| dbverify | 物理 | 否 | 用于验证数据文件dbf、表、索引等,能够校验open阶段的数据文件以及shutdown状态下的数据文件,检查块的一致性错误。 |
| exp/expdp | 物理 | 否 | exp:对于包含坏块的表执行导出操作,会收到相关的错误信息。 expdp:不会给出坏块的提示,只会将对象正确的数据导出。 |
| analyze | 逻辑 | 否 | analyze命令的主要目的是通过分析数据库对象,为优化器收集数据库对象的统计量信息,以便优化器生成准确的执行计划。同时,它也能检查某个表或索引是否存在损坏的情况。 |
| dbms_repair | 逻辑 | 是 | |
| rman | 物理and逻辑 | 是 | RMAN是一块备份工具,就像一个过滤器,RMAN需要通过缓存过滤每一个块,其中一个特点就是检查块是否被损坏。如果备份的数据库中包含有坏块,将会收到错误 |

查询坏块的视图:

SQL> select * from v$database_block_corruption;

###V$DATABASE_BLOCK_CORRUPTION显示有关上次备份后损坏的数据库块的信息。

FILE#: 包含损坏块的数据文件的绝对文件号(坏块所在的文件)

BLOCK#: 损坏块范围内第一个损坏块的块号(坏块的坏块号)

BLOCKS: 从开始找到的损坏块数BLOCK#

CORRUPTION_CHANGE#: 检测到逻辑损坏的更改号。设置为0表示介质损坏。

CORRUPTION_TYPE: 数据文件中的块损坏类型:

ALL ZERO:磁盘上的块头只包含零。如果该块从未被填充并且位于Oracle7文件中,则它可能是有效的。对于空块,缓冲区将被重新格式化为Oracle8标准。

FRACTURED:块头看起来很合理,但是块的前后是不同的版本。

CHECKSUM:可选检查值显示该块不是自洽的。无法确定校验值失败的确切原因,但它可能会失败,因为块中间的扇区来自不同的版本。

CORRUPT:块被错误识别或不是数据块(例如,数据块地址丢失)

LOGICAL:块逻辑损坏

相关参数:

db_block_checksum DB_BLOCK_CHECKSUM确定是否DBWn直接加载程序将计算校验和(从存储在数据块中的所有字节计算出的数字),并在将数据块写入磁盘时将其存储在每个数据块的缓存头中。

如果此参数为,则块为只读时校验与TYPICAL或者FULL并且该块的最后一次写入存储了校验和。在...里FULL模式下,Oracle还会在应用update/delete语句的更改之前验证校验和,并在应用更改后重新计算校验和。此外,Oracle会在将每个日志块写入当前日志之前为其提供一个校验和。

大多数日志块校验和由生成前台进程完成,而LGWR或LGWR从进程(LG神经网络进程)执行其余的工作,以获得更好的CPU和缓存效率。

如果此参数设置为OFF, DBWn仅为计算校验和SYSTEM表空间,但不适用于用户表空间。此外,当此参数设置为时,不执行日志校验和OFF.

校验和允许Oracle检测由底层磁盘、存储系统或I/O系统导致的损坏。如果设置为FULL, DB_BLOCK_CHECKSUM还捕获内存中的损坏,并阻止它们进入磁盘。在中打开此功能TYPICAL模式只会导致1%到2%的额外开销。在......里FULL模式会导致4%到5%的开销。Oracle建议您设置DB_BLOCK_CHECKSUM到TYPICAL.

db_block_checking DB_BLOCK_CHECKING指定Oracle数据库是否对数据库块执行块检查。Oracle通过遍历块中的数据来检查块,确保它在逻辑上是一致的。块检查通常可以防止内存和数据损坏。在大多数应用程序中,数据块检查通常会导致1%到10%的开销,具体取决于工作负载和参数值。特定的DML开销可能会更高。工作负载中的更新或插入越多,启用块检查的代价就越大。你应该设置DB_BLOCK_CHECKING到FULL如果性能开销是可接受的。参数有如下几个值: OFF or FALSE:不对用户表空间中的块执行块检查。但是,语义块检查SYSTEM表空间块总是打开的。

LOW:在内存中的块内容改变后(例如UPDATE, INSERT或者DELETE语句,或者在Oracle RAC中的实例间块传输之后)。

MEDIUM:全部LOW对除索引之外的所有对象执行检查和完整的语义检查(遇到损坏时,可以通过drop+rebuild来重建索引的内容)。

FULL or TRUE:全部LOW和MEDIUM对所有对象执行检查和完整的语义检查。

那么开始今天的案例吧!!!

案例开始

一、模拟表数据

sql 复制代码
[oracle@11g full]$ sqlplus test/123456
SQL>
create table tb1 (id number(10),name varchar2(10));
insert into tb1 values (1,'itpux01');
insert into tb1 values (2,'itpux02');
insert into tb1 values (3,'itpux03');
insert into tb1 values (4,'itpux04');
insert into tb1 values (5,'itpux05');
commit;

二、对库进行全备 (坏块从rman备份中恢复)

这里我就不写全备的脚本了,小伙伴可以跳转到👉【Oracle篇】rman标准化全库备份策略:完整备份or增量备份(第三篇,总共八篇)_rman增量备份-CSDN博客👈进行参考哦

三、查看对象的块信息

sql 复制代码
[oracle@11g full]$ sqlplus / as sysdba
SQL> select * from dba_segments where owner='TEST' and segment_name='TB1';    ###通过dba_segments视图查看表对象开始的头块ID
sql 复制代码
SQL> select * from dba_extents where owner='TEST' and segment_name='TB1';     ###dba_extents查看每个区开始的块

四、破坏user表空间的8404、8405块

sql 复制代码
[oracle@11g orcl]$
dd of=/oracle/app/oracle/oradata/orcl/users.264.1140874093 bs=9182 conv=notrunc seek=8404 <<EOF
New corrupted block!
EOF
###将users表空间的8404块输入New corrupted block!内容
sql 复制代码
[oracle@11g orcl]$
dd of=/oracle/app/oracle/oradata/orcl/users.264.1140874093 bs=9182 conv=notrunc seek=8405 <<EOF
New corrupted block!
EOF
###将users表空间的8405块输入New corrupted block!内容

五、 验证是否存在坏块

方式一:通过rman的验证备份

sql 复制代码
RMAN> backup validate database;  
###扫描数据库的物理/逻辑错误,并不执行实际备份,如果有坏块会报出来。验证每个数据文件,status为FAILED,Blocks Failing(坏块)有内容需要先dbv验证坏块编号,然后rman修复坏块。
File   Status   Marked Corrupt   Empty Blocks   Blocks Examined   High SCN
-----  ----------  -----------------------   ------------------   -----------------------   ------------
5     FAILED          0         124840          131072        8866322   
File Name: /oracle/app/oracle/oradata/orcl/users.264.1140874093
Block Type   Blocks Failing   Blocks Processed
--------------   -------------------  ------------------------
  Data           0            5552            
  Index          0             391             
  Other          2             289 

方式二:通过视图

sql 复制代码
SQL> select * from v$database_block_corruption;    ###V$DATABASE_BLOCK_CORRUPTION显示有关上次备份后损坏的数据库块的信息。

方式三:通过dbv验证数据文件是否有坏块

sql 复制代码
[oracle@11g ~]$ dbv  file=/oracle/app/oracle/oradata/orcl/users.264.1140874093

**解析一:**文件5的8404、8495是坏块

解析二: Total Pages Marked Corrupt : 2 已标记为损坏的页面总数。文件中有2个坏块

五、通过rman备份片恢复坏块。关于blockrecover命令可以参考之前的文章哦**** 👉【Oracle篇】rman工具实用指南:常用命令详解与实践(第二篇,总共八篇)-CSDN博客👈

sql 复制代码
[oracle@11g ~]$ rman target /
RMAN> blockrecover datafile 5 block 8404;  
RMAN> blockrecover datafile 5 block 8405;    ###从备份中恢复这个数据文件坏掉的块,支持多个坏块同时修复(blockrecover datafile 4 block 23657,23658)

六、验证是否还存在坏块

方式一:通过rman的验证备份

sql 复制代码
RMAN> backup validate database;      ###所有的文件status为OK,Blocks Failing为0

方式二:通过视图

sql 复制代码
SQL> select * from v$database_block_corruption;    ###V$DATABASE_BLOCK_CORRUPTION显示有关上次备份后损坏的数据库块的信息。没有输出就表示不存在坏块

方式三:通过dbv验证数据文件是否有坏块

sql 复制代码
[oracle@11g ~]$ dbv  file=/oracle/app/oracle/oradata/orcl/users.264.1140874093
解析:
Total Pages Examined         : 131072        总共处理了131072个块(页),一个数据块大小(show parameter block),此数据文件大小为1G
Total Pages Processed (Data) : 5552          数据文件中已用数据的块数(页数),此数据文件只用了43M
Total Pages Failing   (Data) : 0             文件中有问题的块数(页数),此数据文件正常
Total Pages Processed (Index): 391           文件中索引占用的块数(页数),索引用3M
Total Pages Failing   (Index): 0             文件中有问题索引的块数(页数),索引正常
Total Pages Processed (Other): 289           文件中其他对象占用的块数(页数),其他对象占用了2M
Total Pages Processed (Seg)  : 0             文件中数据段占用的块数(页数)
Total Pages Failing   (Seg)  : 0             文件中有问题数据段的块数(页数)
Total Pages Empty            : 124840        数据文件没有用的数据块(页数)
Total Pages Marked Corrupt   : 0             文件坏块的块数(页数)
Total Pages Influx           : 0             如果值大于零,且未存在坏块的情况下,是由于处于open的文件,运行dbv程序遇到了一个当前正在被dbwn进程写入的数据块
Total Pages Encrypted        : 0             文件加密占用的块数(页数)
Highest block SCN            : 8866322 (0.8866322)        数据文件scn号

呼,今天的内容不算多,但是整理起来还是很麻烦的,所以希望小伙伴们不吝自己的小手点赞、收藏、加关注。不过我也希望大家永远不要用到这篇文章,因为生产环境出现坏块是个非常严重的问题,而且有时候rman也发现不了坏块,所以这篇文章以备不时之需,有些技术可能在自己的职业生涯用不上,但是一定是必须要会的,万一那天出现了关于这个问题,自己可以快速借助文档去处理掉🙌

相关推荐
传而习乎13 分钟前
Linux:CentOS 7 解压 7zip 压缩的文件
linux·运维·centos
soulteary14 分钟前
突破内存限制:Mac Mini M2 服务器化实践指南
运维·服务器·redis·macos·arm·pika
gma99939 分钟前
Etcd 框架
数据库·etcd
爱吃青椒不爱吃西红柿‍️42 分钟前
华为ASP与CSP是什么?
服务器·前端·数据库
Yz98761 小时前
hive的存储格式
大数据·数据库·数据仓库·hive·hadoop·数据库开发
苏-言1 小时前
Spring IOC实战指南:从零到一的构建过程
java·数据库·spring
运维&陈同学2 小时前
【zookeeper01】消息队列与微服务之zookeeper工作原理
运维·分布式·微服务·zookeeper·云原生·架构·消息队列
是阿建吖!2 小时前
【Linux】进程状态
linux·运维
Ljw...2 小时前
索引(MySQL)
数据库·mysql·索引
菠萝咕噜肉i2 小时前
超详细:Redis分布式锁
数据库·redis·分布式·缓存·分布式锁