多载波扇区软件告警协同处理案例:光路闪断与RRU硬件隐患的排查(续篇)

上篇案例小结与拓展处理策略

(1)更换光模块可能解决了最明显的故障点,仍可持续观察该扇区和AAS模块的运行状态。

(2)基础工作中,针对最常见的光路故障点,优先尝试更换光模块、清洁光纤接口等操作,解决大部分显性问题。

(3)拓展处理:若后续再次出现类似软件告警,在不影响业务的前提下,可以尝试将本扇区(如第2扇区)的RRU与相邻扇区(如第1扇区)的RRU进行对调观察,进而定位共扇区下RRU隐患问题。

一、小区告警与初步排查

同一个5G室分站点相隔不到三周,扇区-2再次上软件错误告警,2小区不可用,如下:

经查询,扇区-2状态DISABLED,而RRU状态正常,如下:

扇区-2下挂RRU-3和RRU-4,光路信息正常,如下:

二、站点问题排查

根据上篇拓展处理思路,多载波扇区上软件告警,尚难以定位到RRU-3还是RRU-4,故进行倒换验证,当前5G站点下有两个扇区,分别是扇区-1和扇区-2,并分别下挂RRU-1/2和RRU-3/4。

倒换前

倒换后

20多分钟过后,提取光路信息,发现RRU-3 TX通道无发射信息,而且驻波值偏高,如下:

5G扇区-1上软件错误告警,1小区不可用,现象同原扇区-2,如下:

关闭RRU-3后,1小区可用,如下:

再次激活RRU-3,半小时后扇区-1再次上软件错误告警,如下:

在此期间,扇区-2正常,经倒换的RRU-3,使得扇区-1复现两次软件错误告警,小区不可用,因此故障源头出自RRU-3,已通知代维现场更换。

三、小结

通过RRU交叉倒换法,精准定位了导致小区频繁上报软件错误告警并退服的故障根源为RRU-3硬件故障。

本次排查遵循上次拓展思路,将故障现象复现并转移,结合光路信息检测(如TX无发射、驻波值偏高等),进一步锁定RRU-3发射链路异常问题,而且只要RRU-3是激活态,故障现象就会复现,最终确认故障源头。

相关推荐
eastyuxiao5 小时前
思维导图拆解项目范围 3 个真实落地案例
大数据·运维·人工智能·流程图
GanGanGanGan_5 小时前
RustDesk 安装指南 — Rocky Linux 9 + XFCE X11
linux·运维·centos
风落无尘5 小时前
《智能重生:从垃圾堆到AI工程师》——第五章 代码与灵魂
服务器·网络·人工智能
南境十里·墨染春水9 小时前
linux学习笔记 网络编程——Socket入门与TCP客户端/服务器实现
linux·服务器·网络
Sirens.9 小时前
twikoo:从MongoDB Atlas到本地部署
运维·服务器
Meya11279 小时前
别再人工硬扛机房管理!智能 U 位系统,让机房管理一键数字化
大数据·运维
DFT计算杂谈10 小时前
自动化脚本一键绘制三元化合物相图
java·运维·服务器·开发语言·前端·python·自动化
Yupureki10 小时前
《Linux网络编程》6.UDP原理
linux·运维·服务器·网络·udp
楼田莉子11 小时前
Linux网络:NAT_代理
linux·运维·服务器·开发语言·c++·后端
烛衔溟11 小时前
TypeScript 索引签名、只读数组与 keyof / typeof 入门
linux·ubuntu·typescript