Oracle添加ASM磁盘故障

问题背景

近期处理了2起ASM添加磁盘出现的故障,问题现象类似,处理方式也类型。存在共性,所以整理了下相关故障信息,做了一些总结,希望能对大家带来一些参考意义。

故障分析与处理

案例一、某客户

1.1、问题分析

增加磁盘,日志中可以看到已经成功完成磁盘组中disk的添加

半个小时后,磁盘头异常:报ORA-15196错误,提示ASM块头无效。

Rebanlence过程中,突然asm磁盘头故障:

接着磁盘组dismount,磁盘被标记为"de-assignment"

通过查询官网,可以看到BUG造成。

增加磁盘出现问题

只能重建磁盘组恢复

1.2、问题处理

1.2、问题处理

 切换dg(...过程略)

 老生产禁用和停止相关服务,避免业务连接到老生产

srvctl disable scan_listener

srvctl disable scan

srvctl disable listener -n test1

srvctl disable listener -n test2

srvctl disable vip -n test1

srvctl disable vip -n test2

停scan监听

srvctl stop scan_listener

停scan vip

srvctl stop scan

关监听和VIP服务

srvctl stop listener -n rac1

srvctl stop vip -n rac1

srvctl stop listener -n rac2

srvctl stop vip -n rac2

检查ip地址,scan ip和vip是否下掉,并重启验证。

 重建老库磁盘组

检查db磁盘组的磁盘,并dd掉对应的磁盘头

select * from v$asm_disk;

如:

dd if=/dev/zero of=/dev/asm-diskm bs=1024k count=100

重建磁盘组:

create diskgroup DB external redundancy disk '/dev/asm-diskl','...','/dev/asm-diskm' attribute 'compatible.asm'='11.2.0.0.0';

 单独启动db监听(...过程略)

 搭建dg(...过程略)

案例二、某医院

客户数据库由于出现归档日志异常增长现象,导致asm磁盘组空间被撑满。应急处理删除部分归档,后续规划进行磁盘组扩容,计划晚上添加磁盘。

客户提供了2块1T共享盘,当晚完成了ASM扩容,扩容后客户反馈,业务出现了业务无法连接。排查发现实例宕了,DATA磁盘组无法mount。

2.1、问题分析

1、 ASM告警日志

问题时间出现告警,DATA磁盘组成员盘newdata03(DATA_0000)异常导致磁盘

组无法挂载。磁盘头异常:报ORA-15196错误,提示ASM块头无效,同时伴随其ORA报错。

2、 磁盘权限及磁盘报错au块检查

通过kfed检查磁盘权限正常。磁盘对应au块显示损坏

3、 系统磁盘检查

排查发现新增DATA磁盘组成员盘newdata03(DATA_0000),在系统上已经作为rman备份lv在使用。由此导致了DATA磁盘组的状态异常。

相关推荐
DokiDoki之父1 小时前
Mybatis—入门 & (配置)SQL提示和日志输出
数据库·sql·mybatis
TDengine (老段)2 小时前
TDengine 数据函数 LN 用户手册
大数据·数据库·物联网·时序数据库·tdengine·涛思数据
机灵猫2 小时前
Redis 在订单系统中的实战应用:防重、限流与库存扣减
数据库·redis·缓存
木易2.02 小时前
从零构建RAG知识库管理系统(二)
数据库·oracle
程序新视界2 小时前
什么是MySQL JOIN查询的驱动表和被驱动表?
数据库·后端·mysql
lingggggaaaa3 小时前
小迪安全v2023学习笔记(一百三十四讲)—— Windows权限提升篇&数据库篇&MySQL&MSSQL&Oracle&自动化项目
java·数据库·windows·笔记·学习·安全·网络安全
小光学长3 小时前
基于Vue的保护动物信息管理系统r7zl6b88 (程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
前端·数据库·vue.js
一匹电信狗3 小时前
【MySQL】数据库的相关操作
linux·运维·服务器·数据库·mysql·ubuntu·小程序
TDengine (老段)5 小时前
连接 TDengine 遇到报错 “failed to connect to server, reason: Connection refused” 怎么办?
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
李慕婉学姐5 小时前
Springboot黄河文化科普网站5q37v(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
数据库·spring boot·后端