基于StyleGAN2-ADA和FNW YOLOv8的玉米害虫智能检测
刘浏¹, 薛凯¹, 姬琪琪¹,*
¹ 马来西亚吉隆坡泰莱大学应用计算硕士(MAC)
电子邮箱: 0369721@sd.taylors.edu.my
接收日期:2024年8月9日
发布日期:2024年11月14日
Measurement Science and Technology
https://iopscience.iop.org/article/10.1088/1361-6501/ad8cf4
摘要
玉米害虫的早期快速精准检测对于减少作物经济损失至关重要。针对实际生产环境中玉米害虫识别效果差、效率低的问题,本研究提出了一种基于StyleGAN2和FNW YOLOv8方法的玉米害虫智能检测方法。通过StyleGAN2-ADA扩充玉米害虫数据。在特征提取网络中,替换了Fasternet轻量级网络以降低模型复杂性并加速检测。在特征融合网络的后端集成了基于归一化的注意力模块(NAM),以抑制冗余的非显著特征表示。优化损失函数为Wise Intersection of Union v3(WIoU v3)后,引入了FNW YOLOv8算法。研究结果表明,与基线模型相比,该算法在精度和F1评分方面分别提高了3.77%和5.95%。尤其是,FNW YOLOv8模型实现了实时检测速度达289.1 fps。与常规模型相比,FNW YOLOv8模型有效解决了标准模型中存在的冗余权重问题。FNW YOLOv8的参数量被减少至仅1.74百万,模型大小仅为2.36 MB。同时,FNW YOLOv8的GFLOPS运算量显著降低。因此,为保证玉米害虫识别的精度和时效性,建立其在移动设备上的识别和检测的理论基础至关重要。
关键词: 智慧农业、玉米害虫、深度学习、注意力机制
1. 引言
玉米作为一种重要的经济作物,在世界各地广泛种植【1】。然而,各种害虫的存在导致了玉米产量的大幅减少,进而影响农业活动的经济效益。及时检测害虫对于成功管理和减少玉米害虫的侵害至关重要【2】。
目前,玉米害虫的识别方法通常依赖于知识渊博的专家进行筛查,这需要较高的专业水平以及大量的时间和精力【3】。然而,这些方法可能无法准确区分早期害虫,特别是具有相似物候特征的害虫,从而可能延误控制措施的实施【4-6】。
人工智能、深度学习和计算机视觉技术的快速发展,催生了诸如实时检测变换器(RT-DETR)【7】、单次多框检测器(SSD)【8】、"你只看一次"(YOLO)【9-11】以及快速区域卷积神经网络(Faster R-CNN)【12】等经典框架,这些已成为作物检测的重要工具。这些技术能够在害虫检测过程中自动识别和分析作物(如玉米)的信息。近年来,国内外许多学者利用深度学习和目标检测技术识别作物中的虫害区域,并用于害虫管理目的【13】。
害虫识别对于利用智能技术开展精准农业的预警系统至关重要。Tian【14】提出了一种改进的YOLO模型,用于检测三种典型的小目标鳞翅目害虫,旨在解决害虫区域多尺度密度问题。通过在特征提取过程中引入自适应注意力模块,该模型增强了对特征表示的有效利用能力。然而,模型的F1值为79.1%,表明仍有改进空间。
现有基于深度学习的害虫检测算法通常需要大量的计算资源和内存。Xu【15】通过重新构建骨干网络(使用Stem和ShuffleNet V2)并调整颈部网络宽度,开发了一种基于YOLOv5的轻量级害虫模型。与其他模型相比,该模型显著降低了模型复杂性,例如参数量减少了95.1%,模型大小减少了92.5%,浮点运算数减少了81.6%,但其精度并不高。在害虫区域检测中平衡精度和轻量化仍是极具挑战性的任务。
此外,数据集也影响了害虫检测的进展。Zhang【16】利用StyleGAN2扩展并生成了一个公共数据集,随后使用改进的YOLOv7模型检测葡萄叶片上的早期害虫。通过在目标检测前对图像进行增强,可以改善光照环境并突出害虫特征。
Zhang【17】在检测小麦枯萎病时,使用了一种具有旋转配置的YOLO小麦检测网络,并结合了简单的空间注意力网络,能够检测任意方向的麦穗图像,效率得到了提高。Ali【18】基于YOLOv5提出了一种茶叶害虫检测模型YOLO-Tea,旨在利用卷积神经网络自动提取茶叶害虫特征并进一步进行害虫检测。尽管该模型能够有效表达局部特征,但无法捕获长距离像素之间的全局相关信息。Zhuang【19】采用改进的Faster R-CNN检测图像中的玉米害虫区域。然而,该模型实时检测能力较差,不利于后期硬件部署。
上述研究表明,利用目标检测技术检测作物害虫是可行的,但很少有研究聚焦于大规模采集玉米目标害虫图像数据的难点【20】。此外,现有模型的检测精度低且检测速度慢。为解决上述问题,本研究提出了FNW YOLOv8(FasterNet-NAM-WIoUv3 YOLOv8)模型。
应用带自适应鉴别器增强的StyleGAN2扩充玉米害虫数据,有助于提高模型稳定性并避免过拟合问题,从而有效提升模型精度。
模型采用轻量化的FasterNet网络模型,降低了网络复杂性,实现算法轻量化。
引入NAM注意力机制,有效消除冗余特征信息,增强特征提取过程,从而提高模型的精度和检测速度。
模型损失函数采用WIoU v3,通过减少与距离和横纵比相关的惩罚项的干扰,有效提升了玉米害虫检测的定位性能。
2. 数据与方法
2.1 数据准备
数据集采集于重庆市农业科学院黄田玉米研究基地(东经106°20′,北纬29°29′)的田间。数据使用高清Canon EOS 6D相机拍摄,分辨率为6960×4640。相机设置为M档自动格式,从叶片上方20-30厘米的多个角度进行拍摄,确保每片害虫叶片都能被完整捕获,并保持图像清晰可见。在采集数据时,考虑了光照条件等环境因素。数据分别在晴天、阴天、阴雨天等不同天气下采集,并在一天中的早晨、上午、正午和下午拍摄,覆盖不同区域受害的玉米害虫情况。
2.1.1 StyleGAN2-ADA
数据扩展是害虫检测中的关键环节。利用StyleGAN2-ADA【21】生成多种高质量图像,能够有效扩展原始数据集,增强机器学习模型的泛化能力,并降低过拟合风险。这种方法不仅提高了模型应对未见或稀有害虫样本的能力,还提升了检测精度,同时节省了采集大量图像数据的时间和资源。StyleGAN2-ADA以640 × 640像素的分辨率生成玉米害虫图像。