基于深度学习的苹果产量预测的系统设计与实现

摘要：苹果产量的准确预测对于果园管理、市场规划和经济效益评估具有重要意义。传统的人工统计方法耗时费力且精度有限，难以满足现代农业智能化发展的需求。本文设计并实现了一套基于深度学习的苹果产量预测系统，旨在通过计算机视觉技术实现苹果的自动检测、尺寸测量与产量预测。

项目简介

基于YOLOv8深度学习模型的智能苹果检测与产量预测系统，支持图片、视频、实时摄像头多模式检测，集成机器学习回归预测和可视化分析功能。

系统概述

本系统采用YOLOv8目标检测模型作为核心算法，实现了对图片、视频和实时摄像头画面中苹果的高精度检测与识别。针对果园环境中苹果遮挡、重叠等复杂场景，系统引入了基于IOU匹配和中心距离的跨帧跟踪算法，有效解决了视频检测中的重复计数问题。在尺寸测量方面，系统通过边界框几何特征估算苹果直径，并基于经验公式计算单果重量，实现了苹果的自动分级（小、中、大、特大）。

在方法上，系统采用 YOLOv8 目标检测模型对香梨果实进行识别与计数，并提取果实数量、检测置信度、检测框面积、果实密度、重叠率、空间分布均匀度和估算总重量等特征。在此基础上，构建线性回归、随机森林回归和梯度提升回归等产量预测模型，通过性能对比选取最优模型用于产量估算。同时，引入基于规则的估算方法作为补充，以提高系统在不同场景下的适用性。系统基于 Python 开发，并结合 PyQt 实现图形化界面。

在产量预测模块，本系统提出了规则预测与回归预测相结合的双模式预测方法。规则预测基于检测到的苹果数量和平均重量进行快速估算；回归预测则利用随机森林、XGBoost、LightGBM等多种机器学习模型，通过提取苹果数量、平均置信度、平均直径、尺寸分布等特征，建立从检测结果到实际产量的映射关系，显著提高了预测精度。

系统架构

本系统采用经典的架构设计：

图1 深度学习的苹果产量预测系统

核心亮点

本系统以 YOLOv8 目标检测为核心，融合特征工程、回归预测与可视化界面，实现了苹果果实识别、数量统计和产量估算的一体化智能分析。

算法特点

本算法以 YOLOv8 目标检测为基础，融合果实数量、置信度、直径、重量及尺寸分布等多维特征，并结合回归模型完成苹果产量预测，具有检测与预测一体化的特点。

性能突破

本文在苹果目标检测数据集上开展实验，数据集共包含 1822 张图像和 15309 个标注框，其中训练集 1275 张、验证集 364 张、测试集 183 张。通过 150 轮训练，YOLOv8 模型能够较好地完成苹果果实检测任务，为后续产量预测提供了有效支撑

图2 基线模型性能分析图

核心技术

YOLOv8轻量级目标检测模型，结合高效特征提取与多尺度特征融合技术，在家居场景火焰烟雾数据集（10,156张图像，12,372个标注框）上训练150轮，实现对火焰与烟雾两类目标的高精度实时识别，并结合可视化界面、风险预警和语音播报提升家庭消防安全监测能力。

算法详解

YOLOv8 是 Ultralytics 推出的新一代目标检测模型，在网络结构、检测头设计、损失函数和训练策略等方面对 YOLOv5 进行了优化。该模型提供 N、S、M、L、X 等多种尺度版本，以适应不同场景需求。相比 YOLOv5，YOLOv8 将 C3 模块替换为 C2f 模块，增强了特征提取能力；采用解耦头和 Anchor-Free 机制，提高了检测精度与收敛效率；在损失计算中引入 TaskAlignedAssigner 和 Distribution Focal Loss，增强了边界框回归能力；同时在训练后期关闭 Mosaic 数据增强，进一步提升模型精度与泛化性能。

图3 YOLOv8网络架构图

技术优势分析

YOLOv8 是一种兼顾检测精度与推理效率的单阶段目标检测模型，在苹果果实识别任务中具有较好的应用潜力。其网络结构通过优化特征提取与特征融合过程，增强了模型对复杂场景目标信息的表达能力。模型中引入的 SPPF 模块进一步提升了多尺度特征表征能力，使其能够有效识别苹果在不同尺度、不同遮挡程度及不同光照条件下的视觉特征。与此同时，YOLOv8 采用解耦检测头，将分类与边界框回归任务分离处理，从而提高了模型的训练稳定性和检测精度。实验结果表明，在苹果目标检测数据集（1822 张图像，15309 个标注框）上训练 150 轮后，YOLOv8 对苹果目标取得了较好的识别效果（mAP@0.5 达到 96.1%），能够较好地满足果园场景下果实计数与产量预测的实际需求。

系统功能

本系统集成用户登录注册、图像/视频/摄像头苹果目标检测、果实数量统计、产量预测、检测结果存储及统计分析等功能。

功能概述

本系统面向苹果果实检测与产量预测需求，基于 YOLOv8 目标检测模型实现对图像、视频及摄像头实时画面中苹果目标的识别、定位与可视化展示；系统提供用户登录注册与管理功能，能够对检测结果进行果实数量统计，并结合特征工程与回归模型完成产量预测，同时将检测结果与分析数据进行存储和展示，在统计分析模块中实现检测与预测结果的综合呈现，为果园智能化管理和苹果产量估算提供一体化支持。

系统流程图

系统采用 Python 3.12 开发，基于 Ultralytics YOLOv8 框架实现苹果果实目标检测，使用 PyQt5 构建图形化界面，通过 OpenCV 处理图像、视频和摄像头数据，并结合特征工程与回归分析实现产量预测；同时采用 SQLite 数据库存储用户信息，并对检测结果和分析数据进行管理与展示。系统面向苹果果实检测与产量预测需求，集成用户登录注册、图片检测、视频检测、实时检测、果实计数、产量预测、结果存储与统计分析等功能，为果园智能化管理提供了一体化技术支持。

图4 系统总流程图

系统优势

本系统基于 YOLOv8 目标检测模型，能够较准确地完成苹果果实识别与数量统计，并结合特征工程和回归模型实现产量预测，具备检测与预测一体化的特点。相比传统人工统计方式，系统具有自动化程度高、处理效率快、结果一致性好等优势。与此同时，系统支持图像、视频和摄像头等多种输入方式，并结合 PyQt5 构建可视化界面，具备较好的交互性、实用性和扩展性，可为果园智能管理和苹果产量估算提供有效支持。

运行展示

系统界面采用模块化布局设计，包含顶部状态栏、标签页功能导航和中部主显示区域。系统能够完成图像、视频及摄像头场景下的苹果目标检测，并对检测结果进行可视化展示，同时支持果实数量统计、产量预测及统计分析等功能，具有界面清晰、交互友好和操作便捷等特点。

检测效果展示

登录界面：

图5 登录主界面

用户登录界面，展示系统入口

图6 注册主界面

用户注册界面，新用户创建账号

系统运行模块：

图7 系统运行界面

图8 图片检测-检测完成

图9 图片检测-预测产量

图10 图片检测-CSV导出

图11 图片检测-报告导出

图12 图片检测-CSV导出

图13 视频检测-预测产量

图14 视频检测-CSV导出

图15 视频检测-报告导出

图16 视频检测-实时检测

图17 实时检测-捕获当前帧

图18 整园预测

图19 预测分析-产量分布

图207 预测分析-产量指标

图21 预测分析-尺寸占比

图22 预测分析-质量分析

图23 设置

数据集与训练

本文构建了苹果目标检测数据集，共包含 1822 张图像与 15309 个标注框，其中训练集 1275 张、验证集 364 张、测试集 183 张。模型训练采用 YOLOv8 目标检测框架，输入图像尺寸设为 640×640，batch size 为 8，优化器为 SGD，训练轮数为 150。在 NVIDIA GeForce RTX 4070 Ti SUPER 显卡环境下完成训练后，模型在验证集上取得了较好的检测效果（mAP@0.5 达到 96.1%，mAP@0.5:0.95 达到 65.6%），能够满足苹果果实识别与数量统计任务需求。

数据集构建

本文构建并使用苹果目标检测数据集开展实验研究。该数据集以果园场景中的苹果果实为目标对象，包含不同光照、拍摄角度和背景条件下采集的图像数据，同时覆盖果实在密集分布、局部遮挡和尺度变化等情况下的视觉特征，具有较好的场景代表性。数据集共包含 1822 张图像和 15309 个标注框，其中训练集 1275 张、验证集 364 张、测试集 183 张，对应标注框数量分别为 10573、3040 和 1696。该数据集为 YOLOv8 模型训练、性能验证以及后续系统部署提供了可靠的数据基础。

图24 数据集划分及类别信息统计示意图

训练流程

模型训练采用端到端的方式，首先加载训练集和验证集进行数据预处理，然后加载 YOLOv8n 预训练权重进行模型初始化，接着使用 SGD 优化器进行 150 轮迭代训练，每轮训练后在验证集上评估性能指标，系统自动保存验证集上性能最佳的模型权重，最终输出完整的性能指标和训练曲线。

图26 模型训练流程

训练流程：

开始训练 → 加载训练集和验证集进行数据预处理
模型初始化 → 加载YOLOv8预训练权重（yolov8n.pt），使用标准YOLOv8架构
模型训练 → 使用SGD优化器进行150轮迭代训练，应用数据增强技术
模型验证 → 每轮训练后在验证集上评估性能指标（Precision, Recall, mAP@0.5, mAP@0.5:0.95）
最佳模型保存 → 系统自动监控验证性能，保存验证集上性能最佳的模型权重（best.pt）
训练完成 → 输出完整的性能指标报告和训练曲线图

训练配置

硬件环境:

软件环境

训练超参数

学习率调度策略

学习率调度策略采用线性衰减方式，前3个epoch进行warmup预热，学习率从0线性增长到初始学习率0.01，之后按线性方式从0.01逐步衰减到最终学习率0.0001。

训练结果

训练曲线分析：

下图展示了模型在150轮训练过程中的完整性能变化，包括损失函数曲线和精度指标曲线：

图27 训练曲线分析

图中展示了10个关键指标的训练过程：训练损失（box/cls/dfl）、验证损失（box/cls/dfl）、精确率、召回率、mAP@50和mAP@50-95

（1）损失函数曲线

从训练结果可以看出，模型在训练过程中各项损失函数均呈现稳定下降趋势，说明 YOLOv8 模型能够较好地学习苹果果实目标特征。其中，train/box_loss 由约 1.40 下降至 1.23，train/cls_loss 由约 1.40 下降至 0.65，train/dfl_loss 由约 1.37 下降至 1.23；验证集上的 val/box_loss、val/cls_loss 和 val/dfl_loss 也表现出与训练集基本一致的下降趋势，且整体曲线变化平滑、波动较小，表明模型训练过程较为稳定，未出现明显的过拟合现象。

（2）精度指标曲线

从精度指标变化情况来看，模型各项性能指标均随训练轮次增加而持续提升。Precision 曲线由初始约 80.4% 逐步提升并最终稳定在 93.8%；Recall 曲线由初始约 79.8% 稳步上升至 90.2%；mAP@0.5 由初始约 89.1% 快速提升，最终达到 96.1%；mAP@0.5:0.95 由初始约 53.1% 持续增长至 65.6%。从整体趋势看，模型训练过程大致经历了快速提升、稳定优化和收敛趋稳三个阶段，最终在验证集上取得了较好的检测效果，说明所构建的 YOLOv8 模型在苹果目标检测任务中具有较高的精度和良好的收敛性。

（3）Precision-Recall 曲线

图28 Precision-Recall 曲线

展示模型在不同置信度阈值下的精确率和召回率关系

（4）混淆矩阵（归一化）

图29 归一化混淆矩阵

归一化混淆矩阵展示模型的分类准确性

最佳模型选择

在模型训练过程中，系统依据验证集性能指标自动保存最优模型权重，并以验证集mAP@0.5:0.95作为最佳模型判定标准。当该指标达到当前训练过程中的最高值时，对应模型权重将被保存为best.pt。本次实验中，最优模型出现在第150轮，其验证集mAP@0.5:0.95为0.905，模型文件保存于scripts/runs/train/yolo11_P2_MDH/weights/best.pt

训练稳定性分析

收敛速度：前30轮快速收敛（53.1%% → 62.1%），30-90轮稳定提升，90轮后收敛
过拟合控制：训练集与验证集损失走势一致，无过拟合
训练稳定性：损失曲线平滑，学习率逐步衰减，训练稳定
最终状态：最佳模型第150轮，mAP@50-95达65.6%

项目资源

我们提供项目的完整技术资源，包括源代码、训练脚本、配置文件、数据集和模型权重等全部内容。代码采用模块化设计，结构清晰，注释完善，支持完全复现论文中的所有实验结果。项目提供详细的文件清单和技术架构说明(网页已经提供)，帮助用户快速理解项目结构，便于二次开发和功能扩展。所有资源均已开源，遵循AGPL-3.0协议，用户可自由使用、修改和分发。

关于项目

作者信息

作者：Bob (张家梁)

项目编号：YI_4 & Datasets-18

原创声明：本项目为原创作品