多载波扇区软件告警协同处理案例:光路闪断与RRU硬件隐患的排查(续篇)

上篇案例小结与拓展处理策略

(1)更换光模块可能解决了最明显的故障点,仍可持续观察该扇区和AAS模块的运行状态。

(2)基础工作中,针对最常见的光路故障点,优先尝试更换光模块、清洁光纤接口等操作,解决大部分显性问题。

(3)拓展处理:若后续再次出现类似软件告警,在不影响业务的前提下,可以尝试将本扇区(如第2扇区)的RRU与相邻扇区(如第1扇区)的RRU进行对调观察,进而定位共扇区下RRU隐患问题。

一、小区告警与初步排查

同一个5G室分站点相隔不到三周,扇区-2再次上软件错误告警,2小区不可用,如下:

经查询,扇区-2状态DISABLED,而RRU状态正常,如下:

扇区-2下挂RRU-3和RRU-4,光路信息正常,如下:

二、站点问题排查

根据上篇拓展处理思路,多载波扇区上软件告警,尚难以定位到RRU-3还是RRU-4,故进行倒换验证,当前5G站点下有两个扇区,分别是扇区-1和扇区-2,并分别下挂RRU-1/2和RRU-3/4。

倒换前

倒换后

20多分钟过后,提取光路信息,发现RRU-3 TX通道无发射信息,而且驻波值偏高,如下:

5G扇区-1上软件错误告警,1小区不可用,现象同原扇区-2,如下:

关闭RRU-3后,1小区可用,如下:

再次激活RRU-3,半小时后扇区-1再次上软件错误告警,如下:

在此期间,扇区-2正常,经倒换的RRU-3,使得扇区-1复现两次软件错误告警,小区不可用,因此故障源头出自RRU-3,已通知代维现场更换。

三、小结

通过RRU交叉倒换法,精准定位了导致小区频繁上报软件错误告警并退服的故障根源为RRU-3硬件故障。

本次排查遵循上次拓展思路,将故障现象复现并转移,结合光路信息检测(如TX无发射、驻波值偏高等),进一步锁定RRU-3发射链路异常问题,而且只要RRU-3是激活态,故障现象就会复现,最终确认故障源头。

相关推荐
A小辣椒1 天前
TShark:Wireshark CLI 功能
linux
A小辣椒1 天前
TShark:基础知识
linux
AlfredZhao1 天前
OCI 明明分配了 200G 系统盘,为什么 df 只看到 30G?
linux·oci
AlfredZhao2 天前
vi 删除指定范围的行,不用再反复按 dd
linux·vi
用户9718356334662 天前
银河麒麟 KY10 申威(SW64) 安装 nginx-1.16.1-2.p01.ky10.sw_64.rpm 详细步骤
linux
猪脚踏浪2 天前
linux 拷贝文件或目录到指定的位置
linux
大树883 天前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
摇滚侠3 天前
Linux CentOS7 rpm 安装 MySQL 5.7
linux·运维·mysql
霸道流氓气质3 天前
领域驱动设计(DDD)在 Spring Boot 微服务中的实践指南
运维·spring boot·微服务
bush43 天前
嵌入式linux学习记录十四、术语
linux·嵌入式