YOLO系列论文综述(从YOLOv1到YOLOv11)【第2篇:YOLO系列论文、代码和主要优缺点汇总】

目录

YOLOv1

  • 发表日期:2016年6月
  • 作者:Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi
  • 论文You Only Look Once: Unified, Real-Time Object Detection
  • 代码https://pjreddie.com/darknet/yolo/
  • 主要优缺点
    • YOLO的简单结构,加上其新颖的全图像单次回归,使其比现有的物体检测器快得多,允许实时性能。
    • 然而,虽然YOLO的表现比任何物体检测器都快,但与最先进的方法如快速R-CNN相比,定位误差更大。造成这种限制的主要原因有三个:
      • 在网格单元中最多只能检测到两个相同类别的物体,限制了预测附近物体的能力;
      • 在预测训练数据中未见的长宽比物体时很吃力;
      • 由于下采样层,只能从粗略的物体特征中学习。

YOLOv2 (YOLO9000)


YOLOv3

  • 发表日期:2018年4月
  • 作者:Joseph Redmon, Ali Farhadi
  • 论文YOLOv3: An Incremental Improvement
  • 代码https://pjreddie.com/darknet/yolo/
  • 主要优缺点
    • 使用Darknet-53作为主干网络,结合残差网络提高检测精度;
    • 引入多尺度预测来改善对小物体的检测;
    • 取消软分类器,使用独立的二元分类器提高模型性能。

YOLOv4


YOLOv5

  • 发布日期:2020年6月
  • 作者:Glenn Jocher
  • 论文:无
  • 代码https://github.com/ultralytics/yolov5
  • 主要优缺点
    • 使用Pytorch框架,便于开发者使用和扩展;
    • 自适应的anchor box学习机制提高检测效率;
    • 提供多种尺寸的预训练模型满足不同场景需求。

YOLOv6

  • 发表日期:2022年6月
  • 作者:Chuyi Li等人,美团技术团队
  • 论文YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications
  • 代码https://github.com/meituan/YOLOv6
  • 主要优缺点
    • 使用基于RepVGG的新骨干网络(EfficientRep),比之前的YOLO骨干网络使用了更高的并行度;
    • 标签分配策略采用TOOD中提出的任务对齐学习方法进行标签分配;
    • 使用了变焦损失(VariFocal loss)作为分类损失,以及SIoU/GIoU作为回归损失;
    • 为回归和分类任务引入了自蒸馏策略;
    • 通过使用RepOptimizer和通道级蒸馏的检测量化方案来实现更快的检测器;
    • 这些新特性共同作用,旨在提高模型性能、加速推理过程,并在保持准确性的同时提升效率。

YOLOv7


YOLOv8

  • 发布日期:2023年1月
  • 作者:Ultralytics团队
  • 论文:无
  • 代码https://github.com/ultralytics/ultralytics
  • 主要优缺点
    • 提供可定制的模块化设计方便用户根据需求进行扩展;
    • 内置多种训练和超参数优化策略简化模型调优过程;
    • 集成检测、分割和跟踪功能。

YOLOv9


YOLOv10


YOLOv11

  • 发布日期:2024年9月
  • 作者:Ultralytics团队
  • 论文:无
  • 代码https://github.com/ultralytics/ultralytics
  • 主要优缺点
    • YOLOv11是在YOLOv8基础上进行了改进,同等精度下参数量降低20%,在速度和准确性方面具有无与伦比的性能;
    • 其流线型设计使其适用于各种应用,并可轻松适应从边缘设备到云 API 等不同硬件平台,使其成为各种物体检测与跟踪、实例分割、图像分类和姿态估计任务的绝佳选择。
相关推荐
zzywxc78720 小时前
AI工具全景洞察:从智能编码到模型训练的全链路剖析
人工智能·spring·ios·prompt·ai编程
甄心爱学习20 小时前
DataSet-深度学习中的常见类
人工智能·深度学习
伟贤AI之路20 小时前
【分享】中小学教材课本 PDF 资源获取指南
人工智能·pdf
aneasystone本尊20 小时前
详解 Chat2Graph 的推理机实现
人工智能
金融小师妹20 小时前
多因子AI回归揭示通胀-就业背离,黄金价格稳态区间的时序建模
大数据·人工智能·算法
tangjunjun-owen20 小时前
RT-DETRv2 中的坐标回归机制深度解析:为什么用 `sigmoid(inv_sigmoid(ref) + delta)` 而不是除以图像尺寸?
人工智能·loss·rt-detrv2
deephub20 小时前
机器人逆运动学进阶:李代数、矩阵指数与旋转流形计算
人工智能·机器学习·矩阵·机器人·李群李代数
赴33521 小时前
图像拼接案例,抠图案例
人工智能·python·计算机视觉
Monkey的自我迭代21 小时前
SIFT特征匹配实战:KNN算法实现指纹认证
人工智能·opencv·计算机视觉
明月照山海-21 小时前
机器学习周报十三
人工智能·机器学习·概率论