【导读】
本文提出了一种融合高效局部注意力(ELA)模块和SIoU损失函数的YOLOv8改进模型YOLO-ELA,在无人机绝缘子缺陷检测任务中以96.9%的mAP和74.63 FPS实现了精度与速度的领先。
在本文中,我们提出了一种基于高效局部注意力模块的新型YOLOv8架构,以增强高分辨率无人机航拍图像中绝缘子缺陷检测的准确性和速度。在本文中:
- 我们将基础版本的ELA集成到YOLOv8架构的颈部(neck)组件中,以定位与带有缺陷的绝缘子相关的特征。
- 除了ELA,我们还测试了其他注意力模块,如卷积块注意力模块、高效通道注意力、坐标注意力和混合局部通道注意力。
- 我们实施了SIoU准则函数以减少预测损失,并在小像素信息场景下实现更高的真阳性检测。
- 我们进行了消融实验,以比较基线YOLOv8与改进架构的性能。

论文标题:
YOLO-ELA: Efficient Local Attention Modeling for High-Performance Real-Time Insulator Defect Detection
论文 链接 :
改进的YOLOv8架构
基于卷积的基础模型的最新进展引入了注意力机制 的概念(这一想法最初在基于Transformer的模型中发展),以提高性能和准确性。这包括旨在学习像素级空间信息的空间注意力 (spatial attention) 和专注于通道间依赖关系的通道注意力(channel attention)。将这些注意力机制集成到卷积块中可以产生更鲁棒的特征表示,忽略非显著信息,并最终提高检测精度。在这项工作中,我们旨在通过在YOLOv8的颈部组件中引入ELA模块 来改进对带有缺陷的绝缘子相关丰富特征的捕获方式。此外,我们采用了SIoU准则损失函数来提高模型在小尺寸带缺陷绝缘子上的收敛性和检测精度。
在本研究中,我们通过将ELA模块加入到颈部组件中的四个C2f模块(带两个卷积的跨阶段局部瓶颈模块) 之后来修改YOLOv8架构,以增强高分辨率无人机航拍图像中的绝缘子缺陷检测(参见图1)。条带池化应用于C2f输出 xc ∈ RH×W×C(代表高度、宽度和通道维度),沿着水平(H, 1)和垂直(1, W)方向对每个通道进行计算,生成在第c个通道上高度为h、宽度为w的表示。

在Coovally 模型训练平台集成 1000+主流模型,为用户提供从训练到部署的一站式解决方案,大幅降低算法选型和工程实现的复杂度。
****
!!点击下方链接,立即体验Coovally!!
平台链接: www.coovally.com
在实际使用中,开发者还可以借助 Coovally 平台, 通过 SSH 协议使用熟悉的工具(如 VS Code、Cursor、WindTerm 等)远程连接 Coovally 云端算力资源,进行实时代码开发与调试,享受本地级操作体验的同时,充分利用平台提供的高性能 GPU 加速训练过程。

实验与结果分析
- 数据集
本工作使用的数据集来自两个来源:
- 训练和验证集: NeuroEye团队的Kaziakhmedov和Koposov(2023)开源了一个自行收集的绝缘子数据集。(参见表2)。
- 盲测集(Blind test set): 盲测数据集来自Kaggle上举办的Innopolis高压挑战赛。

- 数据增强
鉴于训练图像数量有限,我们对训练数据进行了增强,以增加数据集的多样性并提高模型在各种情况下的泛化能力。使用的一些增强技术包括水平(左右)和垂直(上下)翻转图像。

- 评估指标
在这项工作中,我们考虑了基于注意力的YOLOv8在实时绝缘子缺陷检测中的应用。我们考虑的主要评估指标是每秒帧数(FPS) ,以及其他指标如参数量(Parameters)、召回率(Recall)、平均精度均值(mAP0.5)和每秒十亿次浮点运算(GFLOPs)。
- 性能评估与分析
如前所述,我们使用低分辨率(320和640)输入图像尺寸的训练集训练我们的模型,然后在输入尺寸为3008的高分辨率测试集上测试其性能。如表3所示,当使用640的输入尺寸训练时,基于注意力的模型的性能通常比使用320时有所提高。

- 消融研究
通过将ELA模块集成到颈部并用SIoU损失替换准则函数来改进基线YOLOv8模型。为了评估这两种增强策略的有效性,我们使用相同的模型配置设置、实验设置和数据条件进行了消融实验。这些实验证明了每项改进对模型性能的影响。
图4展示了使用SIoU和CIoU损失函数的YOLOv8+ELA训练损失曲线之间的比较。可视化分析显示,训练损失随着迭代次数的增加而减少,表明模型正在根据绝缘子数据集调整其权重和参数。

图5描绘了使用GradCAM(梯度加权类激活映射) 生成的基线YOLOv8和YOLOv8+ELA模型的热力图。可以看出,基线模型在更深层(更接近输出层)特别关注了带有缺陷的绝缘子特征和一些背景特征。

图6展示了YOLOv8+ELA在复杂背景条件下的一些检测结果。图像中包含各种物体,如树木、塔检人员、道路网络、汽车和房屋。此外,无人机与塔的距离使得绝缘子在图像中显得很小,这使得检测更具挑战性。尽管存在这些困难,YOLOv8+ELA仍成功检测出所有有缺陷的绝缘子,置信度分数高达80%。

Coovally平台还可以直接查看"实验日志"。提供直观的可视化训练界面,清晰设置参数,监控训练过程(Loss, mAP等指标实时可视化)。

并行实验,效率倍增! 一键发起多个训练任务并行运行,结果一目了然,快速锁定候选者。支持分布式训练,充分利用硬件资源,大幅缩短训练时间。
结论
本研究成功展示了利用高分辨率无人机(UAV)图像集成深度学习技术进行输电线实时检测的应用。研究也验证了,与基线模型相比,基于注意力的单阶段YOLOv8检测器对于高分辨率图像中的缺陷绝缘子实时检测是有效的,即使是在有限且低分辨率的数据集上训练的。尽管训练集仅包含从下往上(bottom-up)角度拍摄的图像,但结果表明,所提出的模型能够有效处理从上往下(top-down)视角拍摄的图像。值得注意的是,我们提出的YOLOv8+ELA模型实现了最高性能,mAP0.5分数高达96.9%,FPS达到74.63。由此,YOLOv8+ELA模型被证明是无人机图像中实时绝缘子缺陷检测的一个鲁棒解决方案,结合了高精确率、高召回率和高mAP性能。该模型在不同视角和分辨率下的泛化能力,使其成为电力线路巡检中可扩展部署的理想候选方案。此外,其在复杂背景和小目标检测等具有挑战性的环境条件下的一致性能,突显了其在提高输电线维护效率和准确性方面的潜力,最终有助于构建更可靠的电力输送系统。