YOLOv1–v11: 版本演进及其关键技术解析

最新消息:Yolo11发布最新版本2024.10

YOLO (You Only Look Once) 是一种高效的目标检测算法,自其初代发布以来,经过多次迭代,逐步提升了检测速度和精度。本文将详细介绍 YOLO 从 v1 到 v11 的各个版本,涵盖每个版本的发布日期、作者、项目地址及主要功能特性。

1. YOLOv1 (2016)

发布日期 : 2016年6月
作者 : Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi
论文 : "You Only Look Once: Unified, Real-Time Object Detection"
项目地址 : YOLOv1 GitHub
主要功能:

  • 创新思想:YOLOv1 首次将目标检测任务转化为一个单次前向传播的问题,显著提升了检测速度。
  • 检测速度快:能够以 45 FPS 的速度处理图像,并且有一个更快的版本可以达到 155 FPS。
  • 限制:YOLOv1 在小物体检测上的精度较差,且定位误差较高。

2. YOLOv2 (2017)

发布日期 : 2017年12月
作者 : Joseph Redmon, Ali Farhadi
论文 : "YOLO9000: Better, Faster, Stronger"
项目地址 : YOLOv2 GitHub
主要功能:

  • YOLO9000:YOLOv2 被称为 YOLO9000,能够检测 9000 种类别物体。
  • 多尺度训练:通过不同分辨率的训练图像增强模型的鲁棒性。
  • Anchor Boxes:引入 anchor boxes 改进了对小物体的检测能力。

3. YOLOv3 (2018)

发布日期 : 2018年4月
作者 : Joseph Redmon, Ali Farhadi
论文 : "YOLOv3: An Incremental Improvement"
项目地址 : YOLOv3 GitHub
主要功能:

  • 改进的网络结构:引入了 Darknet-53 作为主干网络,结合残差网络提高检测精度。
  • 多尺度预测:在不同尺度上进行预测,改善对小物体的检测。
  • 分类器移除:取消了软分类器,使用独立的二元分类器来提高性能。

4. YOLOv4 (2020)

发布日期 : 2020年4月
作者 : Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao
论文 : "YOLOv4: Optimal Speed and Accuracy of Object Detection"
项目地址 : YOLOv4 GitHub
主要功能:

  • Bag of Freebies 和 Bag of Specials:提出了一系列的免费(Freebies)和特效(Specials)优化策略,大幅提高了模型精度。
  • CSPDarknet53:更高效的主干网络,提升了网络的推理速度和精度。
  • CIoU 损失函数:引入 CIoU 损失,提高了边界框回归的性能。

5. YOLOv5 (2020)

发布日期 : 2020年6月
作者 : Glenn Jocher
项目地址 : YOLOv5 GitHub
主要功能:

  • Pytorch 实现:YOLOv5 转向了 Pytorch 框架,便于开发者使用和扩展。
  • 自动学习的 anchor boxes:通过自适应的 anchor box 学习机制,进一步提高检测效率。
  • 丰富的预训练模型:提供了多种尺寸的预训练模型,满足不同场景的需求。

6. YOLOv6 (2022)

发布日期 : 2022年6月
作者 : Meituan 技术团队
项目地址 : YOLOv6 GitHub
主要功能:

  • 行业应用优化:YOLOv6 是针对行业应用优化的版本,尤其注重推理速度。
  • 改进的网络结构:引入 EfficientRep 带来了更高效的网络架构。
  • 支持部署:优化模型部署性能,适合工业环境中的大规模应用。

7. YOLOv7 (2022)

发布日期 : 2022年7月
作者 : Wong Kin-Yiu, Alexey Bochkovskiy, Chien-Yao Wang
论文 : "YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors"
项目地址 : YOLOv7 GitHub
主要功能:

  • 精度和速度的新突破:YOLOv7 在 COCO 数据集上达到了新的速度与精度平衡。
  • 跨尺度特征融合:通过跨尺度的特征融合,提高了对不同尺度物体的检测能力。
  • 动态标签分配:改进了训练过程中的标签分配方式,使得训练效率更高。

8. YOLOv8 (2023)

发布日期 : 2023年1月
作者 : Ultralytics 团队
项目地址 : YOLOv8 GitHub
主要功能:

  • 模块化设计:提供了可定制的模块化设计,方便用户根据需求进行扩展。
  • 自动化训练和优化:内置了多种训练和超参数优化策略,简化了模型调优过程。
  • 集成检测、分割和跟踪:YOLOv8 不仅支持目标检测,还集成了语义分割和目标跟踪功能。

YOLOv9(2024.02)

  • 版本名称: YOLOv9
  • 发布日期: 2024年2月
  • 作者/贡献者: WongKinYiu, 可能还有其他贡献者
  • 项目地址 : GitHub - WongKinYiu/yolov9
  • 主要功能 :
    • 引入了可编程梯度信息(PGI)的概念。
    • 设计了一种新的轻量级网络架构---基于梯度路径规划的通用高效层聚合网络(GELAN)。
    • 提高了模型的学习能力,并在整个检测过程中保留关键信息。
    • 改进了GhostNet主干网络以提高效率。
    • 融合了Involution新卷积算子来增强上下文信息提取能力。
    • 为道路缺陷检测等特定应用场景引入了DCNv4、自研BSAM注意力机制及极简的神经网络VanillaBlock等技术。
    • 替换MobileNetV2作为主干网络实现轻量化。

10. YOLOv10 (2024.05)

发布日期 : 2024.05
作者: 清华大学

论文https://arxiv.org/pdf/2405.14458
项目地址 : https://github.com/THU-MIG/yolov10
主要功能:实时端到端的对象检测。主要是速度和性能方面的提升。

11. YOLOv11 (2024)

发布日期 : 2024.09
作者 : Ultralytics 团队
项目地址 : https://github.com/ultralytics/
主要功能 :
Ultralytics YOLO11 is a cutting-edge, state-of-the-art (SOTA) model that builds upon the success of previous YOLO versions and introduces new features and improvements to further boost performance and flexibility. YOLO11 is designed to be fast, accurate, and easy to use, making it an excellent choice for a wide range of object detection and tracking, instance segmentation, image classification and pose estimation tasks.

相关推荐
向哆哆6 天前
高精度织物缺陷检测数据集(适用YOLO系列/1000+标注)(已标注+划分/可直接训练)
yolo·目标检测
前网易架构师-高司机6 天前
带标注的驾驶员安全带识别数据集,识别率99.5%,可识别有无系安全带,支持yolo,coco json,pascal voc xml格式
xml·yolo·数据集·交通·安全带
向哆哆6 天前
粉尘环境分类检测千张图数据集(适用YOLO系列)(已标注+划分/可直接训练)
yolo·分类·数据挖掘
琅琊榜首20207 天前
移动端AI挂机新范式:YOLOv8+NCNN实现无Root视觉自动化
人工智能·yolo·自动化
智驱力人工智能7 天前
地铁隧道轨道障碍物实时检测方案 守护城市地下动脉的工程实践 轨道障碍物检测 高铁站区轨道障碍物AI预警 铁路轨道异物识别系统价格
人工智能·算法·yolo·目标检测·计算机视觉·边缘计算
智驱力人工智能7 天前
机场鸟类活动智能监测 守护航空安全的精准工程实践 飞鸟检测 机场鸟击预防AI预警系统方案 机场停机坪鸟类干扰实时监测机场航站楼鸟击预警
人工智能·opencv·算法·安全·yolo·目标检测·边缘计算
前端摸鱼匠7 天前
YOLOv8使用 Ultralytics 内置功能简化格式转换:介绍如何使用 yolo mode=data 等相关功能或辅助工具来加速和简化数据格式的准备工作
人工智能·yolo·目标检测·机器学习·目标跟踪·视觉检测
hans汉斯7 天前
《数据挖掘》期刊推介&征稿指南
图像处理·人工智能·算法·yolo·数据挖掘·超分辨率重建·汉斯出版社
卓越软件开发7 天前
毕设全栈开发一条龙:Java/SpringBoot/Vue/ 小程序 / Python / 安卓 / AI 图像识别 人脸检测 车牌识别 YOLO
开发语言·spring boot·python·yolo·小程序·毕业设计·课程设计
向哆哆8 天前
单车/共享单车目标检测数据集(适用YOLO系列)(已标注+划分/可直接训练)
人工智能·yolo·目标检测