1. 模型特点
版本 | 年份 | 核心优势 | 性能指标(COCO) | 依赖库与框架 | 训练网络(骨干) | 数据增强方法 | 适用场景 |
---|---|---|---|---|---|---|---|
YOLOv1 | 2016 | 首个单阶段实时检测模型 | 45.7% mAP / 45 FPS | C/C++、Darknet | 自定义CNN(24层卷积) | 基础缩放、颜色抖动 | 简单实时检测 |
YOLOv2 | 2017 | 引入Anchor Boxes,支持9000类检测 | 56.8% mAP / 40-45 FPS | Darknet、OpenCV | Darknet-19 | 多尺度训练、Anchor聚类 | 多类别检测 |
YOLOv3 | 2018 | 多尺度预测,Darknet-53骨干网络 | 67.3% mAP / 30-45 FPS | Darknet、PyTorch社区版 | Darknet-53 | Mosaic(社区实现) | 复杂场景多目标检测 |
YOLOv4 | 2020 | CSPDarkNet53+SPP/PAN模块,高精度稳定训练 | 43.5% mAP / 60 FPS | Darknet、PyTorch | CSPDarkNet53 + SPP/PAN | Mosaic、CutMix | 工业质检 |
YOLOv5 | 2020 | PyTorch实现,轻量化设计,部署便捷 | 37.4% mAP (s) / 70-140 FPS | PyTorch、ONNX | CSPDarkNet53(Focus模块) | Mosaic、MixUp | 边缘设备 |
YOLOv8 | 2023 | Anchor-Free检测头,支持多任务 | 47.0% mAP (s) / 40-120 FPS | Ultralytics库(PyTorch) | C2F模块 + Anchor-Free | 随机旋转、Albumentations | 小物体检测、多任务集成 |
YOLOv10 | 2024 | 无需NMS后处理,推理速度提升25% | 提升3% vs v8 / 快25%推理速度 | PyTorch、ONNX-Runtime | 轻量CSP + 大核卷积 | 动态尺度训练 | 低功耗设备 |
YOLOv11 | 2024 | 多模态提示(文本/视觉/无提示),企业级部署优化 | 39.5% mAP (n) / 56.1ms延迟 | PyTorch、MMDetection | 多模态Transformer增强 | 多模态混合增强 | AR/VR、机器人交互 |
YOLOe | 2025 | 统一开放集检测与分割,文本/视觉提示 | 零样本AP提升3.5% vs v8 | PyTorch、区域级预训练 | RepRTA + SAVPE模块 | 区域文本对齐 | 智能客服、零售 |
Hyper-YOLO | 2025 | 超图计算建模高阶特征关联 | 提升3.1% mAP (Small) vs v8 | PyTorch、超图计算库 | HyperC2Net(超图融合) | 超边构建 | 自动驾驶、视频分析 |
2. 训练要求
版本 | 训练硬件需求(示例) | 训练时间(2080Ti单卡) | 模型大小(YOLOv5s为基准) |
---|---|---|---|
YOLOv1 | CPU/低端GPU | 3-5天 | 约150MB |
YOLOv3 | 中等GPU(8GB显存) | 2-3天 | 约240MB |
YOLOv5 | 中等GPU(16GB显存) | 1-2天 | 27MB(nano)- 89MB(x) |
YOLOv8 | 高端GPU(24GB显存) | 12-24小时 | 21MB(nano)- 168MB(x) |
YOLOv10 | 边缘GPU(Jetson系列) | 6-12小时 | 8MB(nano)- 50MB(l) |
3. 按硬件条件选择
硬件配置 | 推荐版本 |
---|---|
低端GPU/CPU | YOLOv5nano/YOLOv10nano |
中端GPU(8-16GB) | YOLOv8s/YOLOv5m |
高端GPU(24GB+) | YOLOv8x/Hyper-YOLO |
4. 使用建议:
- 入门学习:YOLOv5(文档丰富,社区支持强);
- 学术研究:YOLOv3/v4(结构透明,适合算法改进);
- 科研实验:Hyper-YOLO(高阶特征建模)、YOLOe(开放集检测)
- 工业部署:YOLOv5/v8(PyTorch生态完善,文档丰富);
- 边缘/移动端应用:YOLOv10(无NMS、低延迟)、YOLOv5nano(超轻量级);
- 多模态任务:YOLOv11(支持文本/视觉提示,开放集检测)。