多载波扇区软件告警协同处理案例:光路闪断与RRU硬件隐患的排查(续篇)

上篇案例小结与拓展处理策略

(1)更换光模块可能解决了最明显的故障点,仍可持续观察该扇区和AAS模块的运行状态。

(2)基础工作中,针对最常见的光路故障点,优先尝试更换光模块、清洁光纤接口等操作,解决大部分显性问题。

(3)拓展处理:若后续再次出现类似软件告警,在不影响业务的前提下,可以尝试将本扇区(如第2扇区)的RRU与相邻扇区(如第1扇区)的RRU进行对调观察,进而定位共扇区下RRU隐患问题。

一、小区告警与初步排查

同一个5G室分站点相隔不到三周,扇区-2再次上软件错误告警,2小区不可用,如下:

经查询,扇区-2状态DISABLED,而RRU状态正常,如下:

扇区-2下挂RRU-3和RRU-4,光路信息正常,如下:

二、站点问题排查

根据上篇拓展处理思路,多载波扇区上软件告警,尚难以定位到RRU-3还是RRU-4,故进行倒换验证,当前5G站点下有两个扇区,分别是扇区-1和扇区-2,并分别下挂RRU-1/2和RRU-3/4。

倒换前

倒换后

20多分钟过后,提取光路信息,发现RRU-3 TX通道无发射信息,而且驻波值偏高,如下:

5G扇区-1上软件错误告警,1小区不可用,现象同原扇区-2,如下:

关闭RRU-3后,1小区可用,如下:

再次激活RRU-3,半小时后扇区-1再次上软件错误告警,如下:

在此期间,扇区-2正常,经倒换的RRU-3,使得扇区-1复现两次软件错误告警,小区不可用,因此故障源头出自RRU-3,已通知代维现场更换。

三、小结

通过RRU交叉倒换法,精准定位了导致小区频繁上报软件错误告警并退服的故障根源为RRU-3硬件故障。

本次排查遵循上次拓展思路,将故障现象复现并转移,结合光路信息检测(如TX无发射、驻波值偏高等),进一步锁定RRU-3发射链路异常问题,而且只要RRU-3是激活态,故障现象就会复现,最终确认故障源头。

相关推荐
北京智和信通7 分钟前
某部队IT基础设施及机房动环统一运维建设实例
运维·网管平台·网管软件·网络管理系统·网络运维平台·网络运维系统
乐维_lwops15 分钟前
从 “救火运维” 到 “自动驾驶”:运维智能体到底解决了什么?
运维·人工智能·运维智能体
bush424 分钟前
嵌入式linux学习记录二
linux·运维·学习
9分钟带帽25 分钟前
linux_通过NFS挂载远程服务器的硬盘
linux·服务器
weixin_4684668541 分钟前
MoneyPrinterTurbo 短视频自动化生产实战指南
运维·人工智能·自动化·大模型·音视频·moneyprinter
難釋懷1 小时前
Nginx自签名-图形化工具 XCA
运维·nginx
迷枫7122 小时前
DM8 目录结构与常用排查入口梳理
服务器·数据库
运维栈记3 小时前
API Error: 400 Request body format invalid
linux·ai
志栋智能3 小时前
小步快跑:从单一场景开启超自动化巡检之旅
运维·网络·人工智能·自动化
AugustRed3 小时前
Linux 运维常用命令大全(超全速查表)
运维·网络·php