Oracle RAC IPC Send timeout detected问题分析处理

一、报错信息

今天在进行数据库巡检时,在集群节点1发现了IPC相关报错信息:

2024-10-10T10:22:06.846317+08:00

IPC Receiver dump detected. Sender instance 2 Receiver pnum 277 ospid 377527 [oracle@zxsszpt-sjkfwq1 (PPA6)], pser 124403

2024-10-10T10:22:06.846665+08:00

GYSTDJY(7):Errors in file /u01/app/oracle/diag/rdbms/utcdb/utcdb1/trace/utcdb1_ppa6_377527.trc:

同时,在节点2有如下信息:

2024-10-10T10:22:50.859603+08:00

GYSTDJY(7):IPC Send timeout detected. Sender: ospid 298373 [oracle@zxsszpt-sjkfwq2]

GYSTDJY(7):Receiver: inst 1 binc 20 ospid 377527

2024-10-10T10:39:59.130691+08:00

Thread 2 advanced to log sequence 85810 (LGWR switch)

Current log# 9 seq# 85810 mem# 0: +DATA/UTCDB/ONLINELOG/group_9.411.1066216577

2024-10-10T10:39:59.929239+08:00

ARC2 (PID:207489): Archived Log entry 171218 added for T-2.S-85809 ID 0x8d8b532a LAD:1

2024-10-10T10:45:18.843834+08:00

GYSTDJY(7):IPC Send timeout detected. Sender: ospid 314725 [oracle@zxsszpt-sjkfwq2]

GYSTDJY(7):Receiver: inst 1 binc 20 ospid 377527

二、问题分析

根据报错信息,首先进行集群心跳检查,经过检查集群心跳正常,心跳网络未出现丢包。

同时查看集群日志以及cssd日志等信息,未发现问题的情况下,在MOS上进行查询,根据报错信息,查到该报错为当前版本bug。

查询信息如下:

报错匹配到的bug为Bug 25174777,并且在Bug 27223075副本中关闭。

三、解决方案

根据MOS查询结果,Bug 27223075在19.1中修复,但当前数据库版本为19.3.0,次bug依旧存在。

查询Bug 27223075的修复补丁,发现只有11.2.0.4、12.1.0.2、12.2.0.1版本相关的补丁:

暂时没有19.X相关补丁提供。

为了避免IPC相关报错导致集群故障,建议对当前环境更新最近补丁。

相关推荐
数据智能老司机9 小时前
CockroachDB权威指南——CockroachDB SQL
数据库·分布式·架构
数据智能老司机10 小时前
CockroachDB权威指南——开始使用
数据库·分布式·架构
松果猿10 小时前
空间数据库学习(二)—— PostgreSQL数据库的备份转储和导入恢复
数据库
无名之逆10 小时前
Rust 开发提效神器:lombok-macros 宏库
服务器·开发语言·前端·数据库·后端·python·rust
s91236010110 小时前
rust 同时处理多个异步任务
java·数据库·rust
数据智能老司机11 小时前
CockroachDB权威指南——CockroachDB 架构
数据库·分布式·架构
hzulwy11 小时前
Redis常用的数据结构及其使用场景
数据库·redis
程序猿熊跃晖11 小时前
解决 MyBatis-Plus 中 `update.setProcInsId(null)` 不生效的问题
数据库·tomcat·mybatis
Three~stone13 小时前
MySQL学习集--DDL
数据库·sql·学习
Qi妙代码13 小时前
MYSQL基础
数据库·mysql·oracle