YOLO系列论文综述(从YOLOv1到YOLOv11)【第2篇:YOLO系列论文、代码和主要优缺点汇总】

目录

YOLOv1

  • 发表日期:2016年6月
  • 作者:Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi
  • 论文You Only Look Once: Unified, Real-Time Object Detection
  • 代码https://pjreddie.com/darknet/yolo/
  • 主要优缺点
    • YOLO的简单结构,加上其新颖的全图像单次回归,使其比现有的物体检测器快得多,允许实时性能。
    • 然而,虽然YOLO的表现比任何物体检测器都快,但与最先进的方法如快速R-CNN相比,定位误差更大。造成这种限制的主要原因有三个:
      • 在网格单元中最多只能检测到两个相同类别的物体,限制了预测附近物体的能力;
      • 在预测训练数据中未见的长宽比物体时很吃力;
      • 由于下采样层,只能从粗略的物体特征中学习。

YOLOv2 (YOLO9000)


YOLOv3

  • 发表日期:2018年4月
  • 作者:Joseph Redmon, Ali Farhadi
  • 论文YOLOv3: An Incremental Improvement
  • 代码https://pjreddie.com/darknet/yolo/
  • 主要优缺点
    • 使用Darknet-53作为主干网络,结合残差网络提高检测精度;
    • 引入多尺度预测来改善对小物体的检测;
    • 取消软分类器,使用独立的二元分类器提高模型性能。

YOLOv4


YOLOv5

  • 发布日期:2020年6月
  • 作者:Glenn Jocher
  • 论文:无
  • 代码https://github.com/ultralytics/yolov5
  • 主要优缺点
    • 使用Pytorch框架,便于开发者使用和扩展;
    • 自适应的anchor box学习机制提高检测效率;
    • 提供多种尺寸的预训练模型满足不同场景需求。

YOLOv6

  • 发表日期:2022年6月
  • 作者:Chuyi Li等人,美团技术团队
  • 论文YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications
  • 代码https://github.com/meituan/YOLOv6
  • 主要优缺点
    • 使用基于RepVGG的新骨干网络(EfficientRep),比之前的YOLO骨干网络使用了更高的并行度;
    • 标签分配策略采用TOOD中提出的任务对齐学习方法进行标签分配;
    • 使用了变焦损失(VariFocal loss)作为分类损失,以及SIoU/GIoU作为回归损失;
    • 为回归和分类任务引入了自蒸馏策略;
    • 通过使用RepOptimizer和通道级蒸馏的检测量化方案来实现更快的检测器;
    • 这些新特性共同作用,旨在提高模型性能、加速推理过程,并在保持准确性的同时提升效率。

YOLOv7


YOLOv8

  • 发布日期:2023年1月
  • 作者:Ultralytics团队
  • 论文:无
  • 代码https://github.com/ultralytics/ultralytics
  • 主要优缺点
    • 提供可定制的模块化设计方便用户根据需求进行扩展;
    • 内置多种训练和超参数优化策略简化模型调优过程;
    • 集成检测、分割和跟踪功能。

YOLOv9


YOLOv10


YOLOv11

  • 发布日期:2024年9月
  • 作者:Ultralytics团队
  • 论文:无
  • 代码https://github.com/ultralytics/ultralytics
  • 主要优缺点
    • YOLOv11是在YOLOv8基础上进行了改进,同等精度下参数量降低20%,在速度和准确性方面具有无与伦比的性能;
    • 其流线型设计使其适用于各种应用,并可轻松适应从边缘设备到云 API 等不同硬件平台,使其成为各种物体检测与跟踪、实例分割、图像分类和姿态估计任务的绝佳选择。
相关推荐
GlobalInfo6 小时前
全球人工智能停车机器人市场份额、规模、技术研究报告2026
人工智能·机器人
XD7429716366 小时前
科技早报|2026年4月30日:AI 基础设施竞赛继续升温
人工智能·科技·科技新闻·科技早报
刘~浪地球6 小时前
DeepSeek V4 技术解读:MoE架构优化深度解析
人工智能·架构·deepseek v4
码点滴6 小时前
私有 Gateway 接入企业 IM:从消息路由到多租户隔离——Hermes Agent 工程实战
人工智能·架构·gateway·prompt·智能体·hermes
财迅通Ai6 小时前
德适发布医疗AI评测平台DoctorBench 智诊科技、谷歌、OpenAl位列三甲
人工智能·科技·德适-b
xiaozhazha_6 小时前
企业级AI视频会议私有化部署实践:应对安全合规与成本挑战的技术架构解析
人工智能·安全·架构
金融小师妹6 小时前
AI治理框架下的货币政策接续:鲍威尔理事留任机制与决策权迁移的系统博弈
大数据·人工智能·逻辑回归·能源
Uopiasd1234oo6 小时前
位置感知注意力与跨阶段部分网络改进YOLOv26特征提取与全局建模能力双重提升
网络·yolo·目标跟踪
Elcker6 小时前
RAG教程-基础篇-第二节 RAG的技术原理
人工智能·ai编程·rag
AGV算法笔记6 小时前
CVPR 2024顶级SLAM论文精读:SplaTAM如何用3D高斯实现稠密RGB-D SLAM?
深度学习·3d·机器人视觉·slam·三维重建