【导读】
针对云南电网输电线路异物检测中小目标、强遮挡、多尺度和复杂背景的难题,本研究对YOLOv8m模型进行三重改进:引入GAM注意力机制强化遮挡目标识别,用SPPCSPC模块替换SPPF增强多尺度特征提取,并采用Focal-EIoU损失函数优化样本不平衡问题。在云南电网真实数据集上,改进模型显著提升性能:mAP₀.₅达95.5%(+2.7%),mAP₀.₅:₀.₉₅达80.4%(+4%),召回率提升6%至91.9%,有效降低漏检率,为无人机智能巡检提供高精度解决方案。>>更多资讯可加入CV技术群获取了解哦~
输电线路上的异物早期检测主要依赖于人工检查,这种方法具有劳动强度高、效率低等特点。随着计算机视觉技术的发展和无人驾驶航空器(UAV)的广泛应用,UAV可以捕捉输电线路的图像。然后,可以通过计算机视觉技术对图像进行分析,自动识别异常,这标志着输电线路检测方法的重大进步。
目前,输电线路目标检测研究主要集中于主成分目标检测、异物检测、烟雾检测、绝缘子缺陷检测等领域。其中,异物检测主要针对四类异物,即气球、鸟巢、风筝和塑料垃圾。然而,在中国云南省高原山地环境中,细长树枝和大鸟也严重干扰高压输电线路的正常运行。因此,我们将细长树枝和鸟类添加到检测数据库中。

论文标题:
Foreign‐Object Detection in High‐Voltage Transmission Line Based on Improved YOLOv8m
论文链接:
arxiv.org/pdf/2502.07...
本文的贡献如下:
(1) 基于中国南方电网公司云南分公司云南电力科学研究院提供的数据,建立了输电线路异物检测数据集。该数据集包含六类物体:垃圾、树枝、鸟巢、风筝、鸟类和气球。在该数据库中,异物存在遮挡、多类型、大规模变化及复杂背景等特征。现有方法的检测准确率不高。
(2) 本文提出了一种基于改进的YOLOv8m的高压输电线路异物检测模型。实验结果表明,该研究模型实现了高准确率,并能满足实际应用的需求。
模型改进方法详解
为解决输电线路中检测异物时面临的遮挡、物体类别多样性、物体尺度显著差异及复杂背景等挑战,本文基于YOLOv8m框架提出了一种改进的异物检测模型。通过在主干网络中融入GAM注意力机制,提升模型对异物的关注度,从而缓解遮挡问题。针对多类别物体与复杂背景的挑战,本文用SPPCSPC模块替换SPPF模块,以增强模型的多尺度特征提取能力。引入Focal-EIOU损失函数以解决高、低质量样本的不平衡问题,从而加速模型收敛并提升检测精度。
增强型YOLOv8m模型
改进后的YOLOv8m模型如图3所示,增强部分以红色框标出,具体说明如下。在图 3 中,GAM 注意力机制被引入到主干网络中,SPPF 模块被替换为 SPPCSPC 模块。

GAM注意力机制
为解决输电线路中检测异物时的遮挡问题,将GAM注意力机制集成到主干网络中,以增强模型对异物的关注度。
全局注意力机制(GAM)是一种通过保留通道和空间信息来丰富跨通道和空间维度之间交互的技术。这种增强对于获取关键目标信息至关重要。
GAM采用CBAM的通道-空间序列,并对通道注意力子模块和空间注意力子模块进行了重新设计,如图4所示。

在公式(1)中,MC表示通道注意力子模块对输入向量F1的处理,在公式(2)中,MS表示空间注意力子模块对向量F2的处理。

在图 5 中,详细说明了图 4 中所示的通道注意力子模块的具体处理流程。通道注意力子模块采用 3D 置换(维度变换)以保留三维信息。随后,一个两层多层感知器(MLP)增强了跨通道和空间维度的跨维度依赖关系。MLP结构是一种编码器-解码器架构,其缩减因子为r。

在图6中,详细阐述了图4中所示的空间注意力子模块的具体处理流程。空间注意力子模块通过两次卷积融合空间信息,以增强对空间信息的关注。此外,在通道注意力子模块中使用缩减因子r以增强对空间特征的注意力,如图6所示。

SPPCSPC 模块
为应对显著的尺度变化、多种类型及复杂背景的外部物体,用 SPPCSPC 模块替换了 SPPF 模块,以增强模型提取多尺度特征的能力。SPPCSPC 模块采用多尺度金字塔池化(SPP)结构与传统卷积操作。该结构扩大了模型的感受野,提升了其在多尺度上提取特征的能力,从而增强了整体检测性能。
如图7所示,SPPCSPC模块将特征分为两个部分。其中一个部分通过 SPP 结构进行处理,采用四个不同尺度下的最大池化操作,以捕获多样化的受容野。此步骤整合了不同维度的空间特征信息,并生成固定尺寸的特征向量。同时,另一个部分进行标准卷积操作。最终,来自这两个部分的特征被拼接成综合特征向量。

焦点-EIoU 损失函数
为了解决高质量样本与低质量样本之间的不平衡问题(即预测框与真实框的并集上不同区域的交集大小),引入了焦点-EIoU 损失函数。焦点-EIoU 损失函数在回归预测边界框至地面 truth 框时,增强了高质量样本(数量较少)的优化贡献,同时减少了低质量样本(数量较多)在该回归过程中的优化贡献。焦点-EIoU 损失函数可有效解决高质量与低质量样本之间的失衡问题,加速模型收敛并提升检测精度。

如图8所示,EIoU损失函数由公式(3)表示。EIoU是评估预测边界框与真实边界框之间差异的度量。焦点-EIoU损失函数利用该度量引导训练过程,强调高质量样本以实现更有效的模型学习与收敛。

实验结果与分析
数据集特性
本研究中使用的输电线路上的异物数据集由中国南方电网股份有限公司云南分公司电力科学研究院提供。


需要特别指出的是,图1中所示的图像并非原始图像。由于部分原始图像中异物体积较小,我们提取了异物周围的局部图像以实现更清晰的展示。


由于输电线上异物出现的频率较低,获取的样本数量有限。这些样本不足以训练神经网络,因此需要进行数据集增强。

通过旋转、亮度变化、噪声和遮挡对数据集进行了增强,最终得到一个包含11,323张图像的扩展数据集。
Coovally 提供强大的数据增强功能,通过自动化应用多样化的数据增强功能(如旋转、翻转、色彩调整、噪声添加等) ,有效扩充训练数据,从而显著提升模型的泛化能力、鲁棒性并降低过拟合风险,用户可通过直观配置轻松实现。

评价指标
本研究消融实验采用七项指标:mAP_0.5、mAP_0.5:0.95、精确率、召回率、参数量、GFloats和速度。对比实验采用五项指标:mAP_0.5、mAP_0.5:0.95、精确率、召回率和速度。
模型训练对比
本实验训练周期为100。图9展示了训练过程中mAP_0.5的对比,图10呈现了mAP_0.5:0.95的对比,图11展示了精确率的对比,图12显示了召回率的对比,图13则对比了分类损失(cls_loss)。从这些图中可以明显看出,模型在各项指标上均优于原始模型。





标注"Original"开头的四条曲线是使用原始数据集训练的模型,分别为:原始模型、加入GAM注意力机制的模型、继续添加SPPCSCP模块的模型、以及继续添加Focal-EIoU损失函数的模型。另外两条标注"dataAugmentation"开头的曲线是使用增强数据集训练的模型,分别为原始模型和改进后的模型。
注意力可视化对比
图14对比了YOLOv8m原始模型与加入GAM注意力机制后的注意力可视化结果。在模型中引入GAM注意力机制后,增强了对目标的关注度,同时降低了对背景的关注。GAM能够提升检测置信度和精确率。


消融实验
为验证改进步骤的有效性,进行了消融实验,结果如表2所示。

如表2所示,不同改进步骤均可提升mAP_0.5、mAP_0.5:0.95和召回率。在同时加入GAM注意力机制、SPPCSPC模块和Focal-EIoU损失函数后,mAP_0.5提高了2.7%,mAP_0.5:0.95提升了4%,召回率提升了6%。值得注意的是,召回率的提升最为显著。在实际应用中,通常会对检测出的图像进行二次人工检测。更高的召回率能有效降低漏检率,从而减轻检测人员的工作负担。
与其他模型的对比实验
为验证改进模型的先进性,对比了当前主流的目标检测模型,使用相同数据集和数据集划分方案。对比实验结果如表3所示。


如表3所示,单阶段方法普遍优于两阶段模型。在mAP_0.5、mAP_0.5:0.95和召回率指标上,实验模型表现最为突出,分别达到95.5%、80.4%和91.9%。虽然在速度上并非最快,但排名第二;在精确率上排名第三。实验模型相比其他检测模型展现出更优越的性能,特别是在mAP_0.5、mAP_0.5:0.95和召回率指标上取得了最高值。
异物的检测结果
图15展示了原始YOLOv8m模型的检测结果,其中(a)、(b)、(c)、(d)、(e)和(f)分别对应垃圾、树枝、鸟巢、风筝、鸟类和气球。图16展示了改进后YOLOv8m模型的检测结果,各子图与图15中的类别一一对应。



在图15和图16中,依次对比各子图的检测结果。在子图15(a)和16(a)中,模型提高了对垃圾目标的检测置信度。在子图15(b)和16(b)中,改进模型消除了对同一树枝不同部位的重复预测和鸟巢的误检,同时提高了树枝检测的置信度。在子图15(c)和16(c)中,改进模型对被遮挡鸟巢的检测表现出更高的置信度。在子图15(d)和16(d)中,改进模型避免了对风筝目标的不完整检测,并提高了风筝目标的检测置信度。在子图15(e)和16(e)中,改进模型消除了对同一鸟类不同部位的重复预测,并提高了鸟类目标的检测置信度。最后在子图15(f)和16(f)中,改进模型提升了对气球目标的检测置信度。
不同类别的检测结果
表4展示了不同模型在检测各类异物时的对比分析。


从表4可以看出,(标记为'Ours')与原始YOLOv8m模型相比,在mAP_0.5、mAP_0.5:0.95和召回率指标上,所有类别的平均精确率整体都有所提升,但精确率有所下降。
具体而言:
- 在mAP_0.5指标上,"树枝"类别的提升最为显著,其他类别也有提升或保持稳定
- 在mAP_0.5:0.95指标上,"树枝"类别进步最大,其他类别也呈现提升或稳定态势
- 在精确率方面,除"树枝"和"气球"有所提升外,其他类别的精确率均下降
- 在召回率方面,所有类别均有提升或保持稳定
经过数据增强后,将改进的模型('Ours')与原始YOLOv8m模型对比发现:
- 在mAP_0.5、mAP_0.5:0.95、精确率和召回率指标上,所有类别的平均精确率整体提升
- 在mAP_0.5指标上,各类别的精确率均上升
- 在mAP_0.5:0.95指标上,各类别的精确率均提高
- 在精确率方面,"鸟巢"有所下降,但其他类别的精确率提升
- 在召回率方面,"鸟巢"呈现下降,但其他类别的精确率上升
无需代码,训练结果即时可见!
在Coovally平台上,上传数据集、选择模型、启动训练无需代码操作,训练结果实时可视化,准确率、损失曲线、预测效果一目了然。 无需等待,结果即训即看,助你快速验证算法性能!

从实验到落地,全程高速零代码
无论是学术研究还是工业级应用,Coovally均提供云端一体化服务:
- 免环境配置:直接调用预置框架(PyTorch、TensorFlow等);
- 免复杂参数调整:内置自动化训练流程,小白也能轻松上手;
- 高性能算力支持:分布式训练加速,快速产出可用模型;
- 无缝部署:训练完成的模型可直接导出,或通过API接入业务系统。
!!点击下方链接,立即体验Coovally!!
平台链接:www.coovally.com
无论你是算法新手还是资深工程师,Coovally以极简操作与强大生态,助你跳过技术鸿沟,专注创新与落地。访问官网,开启你的零代码AI开发之旅!
结论
本文提出了一种基于改进YOLOv8m的输电线路异物检测模型。模型能自动检测电力输电线路航拍图像中的异常情况,减轻异常检测的工作负担,提升巡检效率。
针对电力输电线路异物检测的挑战,采用三项关键改进:首先,为缓解遮挡问题,引入全局注意力机制(GAM),增强对被遮挡目标的关注;其次,针对异物类别多样性和背景复杂性,集成SPPCSPC模块,提升模型的多尺度特征提取能力;第三,引入Focal-EIoU损失函数,解决高低质量样本间的失衡问题,加速模型收敛并提高检测精度。改进后的YOLOv8m模型表现出显著提升,mAP_0.5从92.8%提高到95.5%,mAP_0.5:0.95从76.4%提升至80.4%,召回率从85.9%增至91.9%。