目录
YOLOv1
- 发表日期:2016年6月
- 作者:Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi
- 论文 :You Only Look Once: Unified, Real-Time Object Detection
- 代码 :https://pjreddie.com/darknet/yolo/
- 主要优缺点 :
- YOLO的简单结构,加上其新颖的全图像单次回归,使其比现有的物体检测器快得多,允许实时性能。
- 然而,虽然YOLO的表现比任何物体检测器都快,但与最先进的方法如快速R-CNN相比,定位误差更大。造成这种限制的主要原因有三个:
- 在网格单元中最多只能检测到两个相同类别的物体,限制了预测附近物体的能力;
- 在预测训练数据中未见的长宽比物体时很吃力;
- 由于下采样层,只能从粗略的物体特征中学习。
YOLOv2 (YOLO9000)
- 发表日期:2017年12月
- 作者:Joseph Redmon, Ali Farhadi
- 论文 :YOLO9000: Better, Faster, Stronger
- 代码 :https://pjreddie.com/darknet/yolo/
- 主要优缺点 :
- 能够检测多达9000种类别的物体;
- 多尺度训练增加了模型的鲁棒性;
- 引入anchor boxes改进对小物体的检测能力。
YOLOv3
- 发表日期:2018年4月
- 作者:Joseph Redmon, Ali Farhadi
- 论文 :YOLOv3: An Incremental Improvement
- 代码 :https://pjreddie.com/darknet/yolo/
- 主要优缺点 :
- 使用Darknet-53作为主干网络,结合残差网络提高检测精度;
- 引入多尺度预测来改善对小物体的检测;
- 取消软分类器,使用独立的二元分类器提高模型性能。
YOLOv4
- 发表日期:2020年4月
- 作者:Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao
- 论文 :YOLOv4: Optimal Speed and Accuracy of Object Detection
- 代码 :https://github.com/AlexeyAB/darknet
- 主要优缺点 :
- 提出Bag of Freebies和Bag of Specials优化策略,提高模型精度;
- 使用CSPDarknet53更高效的主干网络,提升网络推理速度和精度;
- 引入CIoU损失函数提高边界框回归性能。
YOLOv5
- 发布日期:2020年6月
- 作者:Glenn Jocher
- 论文:无
- 代码 :https://github.com/ultralytics/yolov5
- 主要优缺点 :
- 使用Pytorch框架,便于开发者使用和扩展;
- 自适应的anchor box学习机制提高检测效率;
- 提供多种尺寸的预训练模型满足不同场景需求。
YOLOv6
- 发表日期:2022年6月
- 作者:Chuyi Li等人,美团技术团队
- 论文 : YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications
- 代码 :https://github.com/meituan/YOLOv6
- 主要优缺点 :
- 使用基于RepVGG的新骨干网络(EfficientRep),比之前的YOLO骨干网络使用了更高的并行度;
- 标签分配策略采用TOOD中提出的任务对齐学习方法进行标签分配;
- 使用了变焦损失(VariFocal loss)作为分类损失,以及SIoU/GIoU作为回归损失;
- 为回归和分类任务引入了自蒸馏策略;
- 通过使用RepOptimizer和通道级蒸馏的检测量化方案来实现更快的检测器;
- 这些新特性共同作用,旨在提高模型性能、加速推理过程,并在保持准确性的同时提升效率。
YOLOv7
- 发表日期:2022年7月
- 作者:Wong Kin-Yiu, Alexey Bochkovskiy, Chien-Yao Wang
- 论文 :YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
- 代码 :https://github.com/WongKinYiu/yolov7
- 主要优缺点 :
- 在COCO数据集上达到新的速度与精度平衡;
- 跨尺度特征融合提高对不同尺度物体的检测能力;
- 改进训练过程中的标签分配方式提高训练效率。
YOLOv8
- 发布日期:2023年1月
- 作者:Ultralytics团队
- 论文:无
- 代码 :https://github.com/ultralytics/ultralytics
- 主要优缺点 :
- 提供可定制的模块化设计方便用户根据需求进行扩展;
- 内置多种训练和超参数优化策略简化模型调优过程;
- 集成检测、分割和跟踪功能。
YOLOv9
- 发布日期:2024年2月
- 作者/贡献者:WongKinYiu等
- 论文 :YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
- 代码 :https://github.com/WongKinYiu/yolov9
- 主要优缺点 :
- 可编程梯度信息(PGI)+广义高效层聚合网络(GELAN);
- 与YOLOv8相比,其出色的设计使深度模型的参数数量减少了49%,计算量减少了43%,但在MS COCO数据集上仍有0.6%的AP改进。
YOLOv10
- 发表日期:2024年5月
- 作者:Ao Wang, HuiChen, LihaoLiu, KaiChen, Zijia Lin, Jungong Han, Guiguang Ding
- 论文 :YOLOv10: Real-Time End-to-End Object Detection
- 代码 :https://arxiv.org/pdf/2405.14458
- 主要优缺点 :
- 实时端到端的对象检测,主要在速度和性能方面的提升。
YOLOv11
- 发布日期:2024年9月
- 作者:Ultralytics团队
- 论文:无
- 代码 :https://github.com/ultralytics/ultralytics
- 主要优缺点 :
- YOLOv11是在YOLOv8基础上进行了改进,同等精度下参数量降低20%,在速度和准确性方面具有无与伦比的性能;
- 其流线型设计使其适用于各种应用,并可轻松适应从边缘设备到云 API 等不同硬件平台,使其成为各种物体检测与跟踪、实例分割、图像分类和姿态估计任务的绝佳选择。