YOLO简史

【欢迎关注编码小哥,学习更多实用的编程方法和技巧】

YOLO历史

YOLO (You Only Look Once) 是一种流行的对象检测和图像分割模型,由华盛顿大学的 Joseph Redmon 和 Ali Farhadi 开发。YOLO 于 2015 年推出,因其高速和准确性而迅速受到欢迎。

YOLOv2 于 2016 年发布,通过合并批量规范化、锚框和维度集群改进了原始模型。

YOLOv3 于 2018 年推出,使用更高效的主干网络、多个锚点和空间金字塔池进一步增强了模型的性能。

YOLOv4 于 2020 年发布,引入了 Mosaic 数据增强、新的无锚点检测头和新的损失函数等创新。

YOLOv5 进一步提高了模型的性能,并添加了新功能,例如超参数优化、集成实验跟踪和自动导出为流行的导出格式。

YOLOv6 由美团于 2022 年开源,并被用于该公司的许多自主送货机器人。

YOLOv7 添加了其他任务,例如对 COCO 关键点数据集进行姿态估计。

YOLOv8 由 Ultralytics 于 2023 年发布。YOLOv8 引入了新功能和改进,以增强性能、灵活性和效率,支持全方位的视觉 AI 任务。

YOLOv9 引入了可编程梯度信息 (PGI) 和广义高效层聚合网络 (GELAN) 等创新方法。

YOLOv10 由清华大学的研究人员使用 Ultralytics Python 包创建。此版本通过引入端到端头来提供实时对象检测改进,消除了非最大抑制 (NMS) 要求。

YOLO11 新功能:Ultralytics 的最新 YOLO 模型在多项任务(包括检测、分割、姿态估计、跟踪和分类)中提供最先进的 (SOTA) 性能,利用了各种 AI 应用程序和领域的功能。

常见问题

什么是 Ultralytics YOLO,它如何改进对象检测?

Ultralytics YOLO 是广受赞誉的 YOLO (You Only Look Once) 系列的最新进展,用于实时对象检测和图像分割。它基于以前的版本构建,引入了新功能和改进,以提高性能、灵活性和效率。YOLO 支持各种视觉 AI 任务,例如检测、分割、姿势估计、跟踪和分类。其最先进的架构确保了卓越的速度和准确性,使其适用于各种应用程序,包括边缘设备和云 API。

如何开始 YOLO 安装和设置?

YOLO 的入门既快速又简单。你可以使用 pip 安装 Ultralytics 软件包,并在几分钟内启动并运行。下面是一个基本的安装命令:

pip install ultralytics

如何在我的数据集上训练自定义 YOLO 模型?

在数据集上训练自定义 YOLO 模型涉及几个详细步骤:

准备带注释的数据集。

在 YAML 文件中配置训练参数。

使用 yolo TASK train 命令开始训练。(每个 TASK 都有自己的参数)

以下是对象检测任务的示例代码:

python 复制代码
from ultralytics import YOLO


# Load a pre-trained YOLO model (you can choose n, s, m, l, or x versions)

model = YOLO("yolo11n.pt")


# Start training on your custom dataset

model.train(data="path/to/dataset.yaml", epochs=100, imgsz=640)

Ultralytics YOLO 有哪些可用的许可选项?

Ultralytics 为 YOLO 提供两种许可选项:

AGPL-3.0 许可证:此开源许可证非常适合教育和非商业用途,促进开放式协作。

企业许可证:专为商业应用程序而设计,允许将 Ultralytics 软件无缝集成到商业产品中,而不受 AGPL-3.0 许可证的限制。

如何使用 Ultralytics YOLO 进行实时对象跟踪?

Ultralytics YOLO 支持高效且可定制的多对象跟踪。要使用跟踪功能,您可以使用 yolo track 命令,如下所示:

python 复制代码
from ultralytics import YOLO


#加载预训练模型

model = YOLO("yolo11n.pt")

#开始追踪视频中的物体,可以使用直播流或者摄像头输入

model.track(source="path/to/video.mp4")
相关推荐
sali-tec2 小时前
C# 基于halcon的视觉工作流-章52-生成标定板
开发语言·图像处理·人工智能·算法·计算机视觉
newxtc2 小时前
【江苏政务服务网-注册_登录安全分析报告】
人工智能·安全·yolo·政务·1024程序员节·安全爆破
王哈哈^_^4 小时前
【数据集】【YOLO】【目标检测】口罩数据集,口罩佩戴识别数据集 1971 张,YOLO佩戴口罩检测算法实战训练教程。
人工智能·算法·yolo·目标检测·计算机视觉·ai·视觉检测
房开民4 小时前
OpenCV C++ 中,访问图像像素三种常用方法
c++·opencv·计算机视觉
格林威5 小时前
紫外工业相机入门介绍和工业检测核心场景
人工智能·数码相机·计算机视觉·目标跟踪·视觉检测
WWZZ20255 小时前
快速上手大模型:深度学习2(实践:深度学习基础、线性回归)
人工智能·深度学习·算法·计算机视觉·机器人·大模型·slam
天天进步20157 小时前
Python全栈项目--基于计算机视觉的车牌识别系统
开发语言·python·计算机视觉
学技术的大胜嗷7 小时前
图像归一化:OpenCV 高效映射 [0,255] → [-1,1] 性能实测
图像处理·opencv·计算机视觉
音视频牛哥8 小时前
低空经济的实时神经系统:空地一体化音视频架构的技术演进
机器学习·计算机视觉·音视频·低空经济·人工智能+·evtol·ai感知网络
leo__5209 小时前
基于MATLAB的图像处理程序
图像处理·计算机视觉·matlab