**摘要:**澳大利亚拥有丰富而独特的野生动物多样性,构成了该国生态遗产的重要组成部分。在广阔而偏远的自然环境中实现准确的物种识别仍面临重大挑战。本研究提出了基于YOLOv9架构改进的模型------YOLO特征与聚类增强模型(YOLO-FCE)。我们通过一系列基于聚类距离的分析方法对模型的特征提取能力进行评估与优化。该模型在包含50种澳大利亚动物物种、每种物种700张图像的数据集上完成训练和测试,共处理35,000张图像。YOLO-FCE模型的平均精度(mAP50:95)达到87.5%,精确度为98.2%;在独立的未见图像验证集上,其识别准确率达到91.29%,平均置信度为0.801。与在同一数据集上评估的YOLOv9、YOLOv11及Faster R-CNN等基线模型相比,YOLO-FCE展现出卓越的性能表现。
用于训练YOLOv9模型的各种超参数值
YOLOv9各变体与YOLO-FCE的性能指标比较
不同模型检测性能的比较
验证结果示例:a) 该模型能在单张图像中识别出同一物种的多个对象(物种:Cacatua galerita);b) 该模型错误地将场景中的某个物体归类为特定物种;c) 该模型能准确区分同一图像中的不同物种,但当前照片标签仅标注了一个物种;d) 图例所示为物种31-Carcharhinus melanopterus的样本图像,由于图像质量较差且存在水下模糊效应,其识别率较低
**结论:**本研究提出了一种高性能野生动物检测模型YOLO-FCE,该模型基于YOLOv9的 GELAN -C架构,并对骨干网络和颈部网络进行了优化。该模型在多种野生动物物种检测中均取得满意效果,通过特征提取分析为物种识别提供了重要见解。然而,数据集范围、目标外观多样性以及数据集结构等局限性引入了偏差,影响了模型性能。