Oracle添加ASM磁盘故障

问题背景

近期处理了2起ASM添加磁盘出现的故障,问题现象类似,处理方式也类型。存在共性,所以整理了下相关故障信息,做了一些总结,希望能对大家带来一些参考意义。

故障分析与处理

案例一、某客户

1.1、问题分析

增加磁盘,日志中可以看到已经成功完成磁盘组中disk的添加

半个小时后,磁盘头异常:报ORA-15196错误,提示ASM块头无效。

Rebanlence过程中,突然asm磁盘头故障:

接着磁盘组dismount,磁盘被标记为"de-assignment"

通过查询官网,可以看到BUG造成。

增加磁盘出现问题

只能重建磁盘组恢复

1.2、问题处理

1.2、问题处理

 切换dg(...过程略)

 老生产禁用和停止相关服务,避免业务连接到老生产

srvctl disable scan_listener

srvctl disable scan

srvctl disable listener -n test1

srvctl disable listener -n test2

srvctl disable vip -n test1

srvctl disable vip -n test2

停scan监听

srvctl stop scan_listener

停scan vip

srvctl stop scan

关监听和VIP服务

srvctl stop listener -n rac1

srvctl stop vip -n rac1

srvctl stop listener -n rac2

srvctl stop vip -n rac2

检查ip地址,scan ip和vip是否下掉,并重启验证。

 重建老库磁盘组

检查db磁盘组的磁盘,并dd掉对应的磁盘头

select * from v$asm_disk;

如:

dd if=/dev/zero of=/dev/asm-diskm bs=1024k count=100

重建磁盘组:

create diskgroup DB external redundancy disk '/dev/asm-diskl','...','/dev/asm-diskm' attribute 'compatible.asm'='11.2.0.0.0';

 单独启动db监听(...过程略)

 搭建dg(...过程略)

案例二、某医院

客户数据库由于出现归档日志异常增长现象,导致asm磁盘组空间被撑满。应急处理删除部分归档,后续规划进行磁盘组扩容,计划晚上添加磁盘。

客户提供了2块1T共享盘,当晚完成了ASM扩容,扩容后客户反馈,业务出现了业务无法连接。排查发现实例宕了,DATA磁盘组无法mount。

2.1、问题分析

1、 ASM告警日志

问题时间出现告警,DATA磁盘组成员盘newdata03(DATA_0000)异常导致磁盘

组无法挂载。磁盘头异常:报ORA-15196错误,提示ASM块头无效,同时伴随其ORA报错。

2、 磁盘权限及磁盘报错au块检查

通过kfed检查磁盘权限正常。磁盘对应au块显示损坏

3、 系统磁盘检查

排查发现新增DATA磁盘组成员盘newdata03(DATA_0000),在系统上已经作为rman备份lv在使用。由此导致了DATA磁盘组的状态异常。

相关推荐
hnlucky几秒前
《基于 Kubernetes 的 WordPress 高可用部署实践:从 MariaDB 到 Nginx 反向代理》
运维·数据库·nginx·云原生·容器·kubernetes·mariadb
dgiij5 分钟前
excel大表导入数据库
数据库·mysql·node.js·excel
多敲代码防脱发9 分钟前
导出导入Excel文件(详解-基于EasyExcel)
java·开发语言·jvm·数据库·mysql·excel
数据库幼崽33 分钟前
MySQL 8.0 OCP 1Z0-908 51-60题
数据库·mysql·ocp
我叫珂蛋儿吖1 小时前
[redis进阶六]详解redis作为缓存&&分布式锁
运维·c语言·数据库·c++·redis·分布式·缓存
小L爱科研1 小时前
4.7/Q1,GBD数据库最新文章解读
数据库·机器学习·数据分析·回归·健康医疗
GUIQU.1 小时前
【MySQL】函数
数据库·mysql
chennalC#c.h.JA Ptho2 小时前
kubuntu系统详解
linux·数据库·经验分享·postgresql·系统安全
DavieLau2 小时前
Python开发后端InfluxDB数据库测试接口
服务器·数据库·python·时序数据库