一、频闪退服告警工单

宏站FDD-LTE站点1小区,出现频闪退服告警;监控提取历史告警,显示小区多次上退服告警,如下:Nblotcell和EutranCellFDD两小区共载频。

二、告警查询与分析
登录站点查询,当前小区状态正常。

实时告警显示:光路RiLink=3,服务降级告警,如下:

告警提示:SFP value (RX-LOW PWR) outside thresholds at near end
在近端(即本端设备)检测到SFP光模块的接收光功率(RX Power)过低,已经低于设备预设的正常工作阈值。
即当前指示指示物理层光纤链路存在硬件告警,提取当前光路信息,如下:

三、常见原因以及排查
1. 物理链路衰减过大(最常见原因)
这是导致接收光功率下降的最直接因素。可能包括:
-
光纤连接器问题(如光模块):光纤端面(如LC/SC接头)污染、划伤或未完全插紧,会导致巨大的插入损耗。
-
光纤本身问题:光纤过度弯曲(曲率半径过小)、受压、老化,或跳线、尾纤存在劣化点。
-
链路距离超限:实际传输距离超过了所用光模块(如多模短距模块)的标准支持范围。
2. 对端发送问题
告警虽在近端,但根源可能在对端:
-
对端光模块发射功率(TX Power)过低或失效:对端SFP模块的激光器(LD)老化、故障,导致发出的光信号本身就弱。
-
对端设备配置或故障:对端设备端口配置错误(如强制百兆模式对接千兆光口),或硬件故障导致发送异常。
3. 本端硬件问题
-
本端SFP光模块故障:本端模块的光电探测器(PD)老化或损坏,导致接收灵敏度下降,即使输入光功率正常也可能误报低压。
-
设备光端口故障:基站设备的光端口硬件损坏。
4. 兼容性与配置问题
-
光模块兼容性:使用了非爱立信官方认证或第三方兼容性不佳的光模块,其DDM读数可能不准确或功率参数不匹配。
-
速率、双工模式不匹配:两端设备的光口速率、双工模式配置不一致,可能导致链路反复协商,伴随光功率异常告警。
针对此告警,可以遵循以下步骤进行排查:
-
检查DDM实时值 :登录基站网管或使用命令行,查看告警SFP端口的实时数字诊断信息,重点记录 RX Power、TX Power、温度等数值。将RX Power值与模块规格书中的接收灵敏度(如-18 dBm)和过载点进行比较,确认其是否确实异常偏低。
-
清洁与紧固光纤连接 :这是首要且成本最低的操作。使用专用的光纤清洁工具(如清洁笔、无尘纸蘸无水乙醇)仔细清洁本端和对端的光纤连接器端面,并确保连接器完全插入且锁紧。
-
分段排查与替换测试:
-
替换跳线:尝试更换连接基站光口的光纤跳线,排除跳线故障。
-
交叉测试:将疑似故障的SFP模块与对端设备的正常模块互换,观察告警是否随模块转移。如果告警跟随模块,则模块故障可能性大;如果仍在原端口,则可能是端口或链路问题。
-
使用光功率计测量:如果条件允许,使用光功率计在基站光口处直接测量接收光功率,与设备DDM读取值进行比对,以判断是模块监测异常还是真实光功率低。
-
-
检查对端设备:协调检查对端传输设备(如交换机、路由器)的对应光口是否有告警(如TX故障、LOS等),并检查其光模块的发送功率是否正常。
-
更换硬件:如果通过以上步骤定位为硬件故障,则更换故障的光模块或光纤跳线。建议优先使用爱立信官方认证的模块以确保兼容性。
-
检查配置:确认基站与对端设备的光口速率、双工模式等配置一致,通常设置为"自协商"(Auto-negotiation)即可,但需确保两端能力匹配。
四、小结
站点小区反复上报退服告警,呈现典型的"频闪告警"特征,经查询站点,直接指示光模块收光弱,触发告警,直接导致小区服务不稳定,反复退网。在网络运维中,对频闪告警不能简单屏蔽或忽略,而应通过工单流程进行闭环管控,深入排查根本原因,以消除网络隐患。