YOLO系列论文综述（从YOLOv1到YOLOv11）【第2篇：YOLO系列论文、代码和主要优缺点汇总】

Donvink2024-11-28 8:00

目录

YOLOv1
YOLOv2 (YOLO9000)
YOLOv3
YOLOv4
YOLOv5
YOLOv6
YOLOv7
YOLOv8
YOLOv9
YOLOv10
YOLOv11

YOLOv1

发表日期：2016年6月
作者：Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi
论文：You Only Look Once: Unified, Real-Time Object Detection
代码：https://pjreddie.com/darknet/yolo/
主要优缺点 ：
- YOLO的简单结构，加上其新颖的全图像单次回归，使其比现有的物体检测器快得多，允许实时性能。
- 然而，虽然YOLO的表现比任何物体检测器都快，但与最先进的方法如快速R-CNN相比，定位误差更大。造成这种限制的主要原因有三个：
  - 在网格单元中最多只能检测到两个相同类别的物体，限制了预测附近物体的能力；
  - 在预测训练数据中未见的长宽比物体时很吃力；
  - 由于下采样层，只能从粗略的物体特征中学习。

YOLOv2 (YOLO9000)

发表日期：2017年12月
作者：Joseph Redmon, Ali Farhadi
论文：YOLO9000: Better, Faster, Stronger
代码：https://pjreddie.com/darknet/yolo/
主要优缺点 ：
- 能够检测多达9000种类别的物体；
- 多尺度训练增加了模型的鲁棒性；
- 引入anchor boxes改进对小物体的检测能力。

YOLOv3

发表日期：2018年4月
作者：Joseph Redmon, Ali Farhadi
论文：YOLOv3: An Incremental Improvement
代码：https://pjreddie.com/darknet/yolo/
主要优缺点 ：
- 使用Darknet-53作为主干网络，结合残差网络提高检测精度；
- 引入多尺度预测来改善对小物体的检测；
- 取消软分类器，使用独立的二元分类器提高模型性能。

YOLOv4

发表日期：2020年4月
作者：Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao
论文：YOLOv4: Optimal Speed and Accuracy of Object Detection
代码：https://github.com/AlexeyAB/darknet
主要优缺点 ：
- 提出Bag of Freebies和Bag of Specials优化策略，提高模型精度；
- 使用CSPDarknet53更高效的主干网络，提升网络推理速度和精度；
- 引入CIoU损失函数提高边界框回归性能。

YOLOv5

发布日期：2020年6月
作者：Glenn Jocher
论文：无
代码：https://github.com/ultralytics/yolov5
主要优缺点 ：
- 使用Pytorch框架，便于开发者使用和扩展；
- 自适应的anchor box学习机制提高检测效率；
- 提供多种尺寸的预训练模型满足不同场景需求。

YOLOv6

发表日期：2022年6月
作者：Chuyi Li等人，美团技术团队
论文： YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications
代码：https://github.com/meituan/YOLOv6
主要优缺点 ：
- 使用基于RepVGG的新骨干网络（EfficientRep），比之前的YOLO骨干网络使用了更高的并行度；
- 标签分配策略采用TOOD中提出的任务对齐学习方法进行标签分配；
- 使用了变焦损失（VariFocal loss）作为分类损失，以及SIoU/GIoU作为回归损失；
- 为回归和分类任务引入了自蒸馏策略；
- 通过使用RepOptimizer和通道级蒸馏的检测量化方案来实现更快的检测器；
- 这些新特性共同作用，旨在提高模型性能、加速推理过程，并在保持准确性的同时提升效率。

YOLOv7

发表日期：2022年7月
作者：Wong Kin-Yiu, Alexey Bochkovskiy, Chien-Yao Wang
论文：YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
代码：https://github.com/WongKinYiu/yolov7
主要优缺点 ：
- 在COCO数据集上达到新的速度与精度平衡；
- 跨尺度特征融合提高对不同尺度物体的检测能力；
- 改进训练过程中的标签分配方式提高训练效率。

YOLOv8

发布日期：2023年1月
作者：Ultralytics团队
论文：无
代码：https://github.com/ultralytics/ultralytics
主要优缺点 ：
- 提供可定制的模块化设计方便用户根据需求进行扩展；
- 内置多种训练和超参数优化策略简化模型调优过程；
- 集成检测、分割和跟踪功能。

YOLOv9

发布日期：2024年2月
作者/贡献者：WongKinYiu等
论文：YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
代码：https://github.com/WongKinYiu/yolov9
主要优缺点 ：
- 可编程梯度信息(PGI)+广义高效层聚合网络(GELAN)；
- 与YOLOv8相比，其出色的设计使深度模型的参数数量减少了49%，计算量减少了43%，但在MS COCO数据集上仍有0.6%的AP改进。

YOLOv10

发表日期：2024年5月
作者：Ao Wang, HuiChen, LihaoLiu, KaiChen, Zijia Lin, Jungong Han, Guiguang Ding
论文：YOLOv10: Real-Time End-to-End Object Detection
代码：https://arxiv.org/pdf/2405.14458
主要优缺点 ：
- 实时端到端的对象检测，主要在速度和性能方面的提升。

YOLOv11

发布日期：2024年9月
作者：Ultralytics团队
论文：无
代码：https://github.com/ultralytics/ultralytics
主要优缺点 ：
- YOLOv11是在YOLOv8基础上进行了改进，同等精度下参数量降低20%，在速度和准确性方面具有无与伦比的性能；
- 其流线型设计使其适用于各种应用，并可轻松适应从边缘设备到云 API 等不同硬件平台，使其成为各种物体检测与跟踪、实例分割、图像分类和姿态估计任务的绝佳选择。

上一篇：技术文档的高质量翻译对俄罗斯汽车推广的影响

下一篇：qsort函数详解+代码展示

热门推荐

01Java学习第十五部分——MyBatis 02集群聊天服务器---MySQL数据库的建立 03Coze扣子平台完整体验和实践（附国内和国际版对比）04基于odoo17的设计模式详解---装饰模式 05使用Ruby接入实时行情API教程 06扣子（coze）实战|我用扣子搭建了一个自动分析小红薯笔记内容的AI应用|详细步骤拆解 07Everything文件检索工具几秒检索几百G的文件 08基于odoo17的设计模式详解---单例模式 09DeepSeek各版本说明与优缺点分析 10【无标题】