YOLO简史

【欢迎关注编码小哥,学习更多实用的编程方法和技巧】

YOLO历史

YOLO (You Only Look Once) 是一种流行的对象检测和图像分割模型,由华盛顿大学的 Joseph Redmon 和 Ali Farhadi 开发。YOLO 于 2015 年推出,因其高速和准确性而迅速受到欢迎。

YOLOv2 于 2016 年发布,通过合并批量规范化、锚框和维度集群改进了原始模型。

YOLOv3 于 2018 年推出,使用更高效的主干网络、多个锚点和空间金字塔池进一步增强了模型的性能。

YOLOv4 于 2020 年发布,引入了 Mosaic 数据增强、新的无锚点检测头和新的损失函数等创新。

YOLOv5 进一步提高了模型的性能,并添加了新功能,例如超参数优化、集成实验跟踪和自动导出为流行的导出格式。

YOLOv6 由美团于 2022 年开源,并被用于该公司的许多自主送货机器人。

YOLOv7 添加了其他任务,例如对 COCO 关键点数据集进行姿态估计。

YOLOv8 由 Ultralytics 于 2023 年发布。YOLOv8 引入了新功能和改进,以增强性能、灵活性和效率,支持全方位的视觉 AI 任务。

YOLOv9 引入了可编程梯度信息 (PGI) 和广义高效层聚合网络 (GELAN) 等创新方法。

YOLOv10 由清华大学的研究人员使用 Ultralytics Python 包创建。此版本通过引入端到端头来提供实时对象检测改进,消除了非最大抑制 (NMS) 要求。

YOLO11 新功能:Ultralytics 的最新 YOLO 模型在多项任务(包括检测、分割、姿态估计、跟踪和分类)中提供最先进的 (SOTA) 性能,利用了各种 AI 应用程序和领域的功能。

常见问题

什么是 Ultralytics YOLO,它如何改进对象检测?

Ultralytics YOLO 是广受赞誉的 YOLO (You Only Look Once) 系列的最新进展,用于实时对象检测和图像分割。它基于以前的版本构建,引入了新功能和改进,以提高性能、灵活性和效率。YOLO 支持各种视觉 AI 任务,例如检测、分割、姿势估计、跟踪和分类。其最先进的架构确保了卓越的速度和准确性,使其适用于各种应用程序,包括边缘设备和云 API。

如何开始 YOLO 安装和设置?

YOLO 的入门既快速又简单。你可以使用 pip 安装 Ultralytics 软件包,并在几分钟内启动并运行。下面是一个基本的安装命令:

pip install ultralytics

如何在我的数据集上训练自定义 YOLO 模型?

在数据集上训练自定义 YOLO 模型涉及几个详细步骤:

准备带注释的数据集。

在 YAML 文件中配置训练参数。

使用 yolo TASK train 命令开始训练。(每个 TASK 都有自己的参数)

以下是对象检测任务的示例代码:

python 复制代码
from ultralytics import YOLO


# Load a pre-trained YOLO model (you can choose n, s, m, l, or x versions)

model = YOLO("yolo11n.pt")


# Start training on your custom dataset

model.train(data="path/to/dataset.yaml", epochs=100, imgsz=640)

Ultralytics YOLO 有哪些可用的许可选项?

Ultralytics 为 YOLO 提供两种许可选项:

AGPL-3.0 许可证:此开源许可证非常适合教育和非商业用途,促进开放式协作。

企业许可证:专为商业应用程序而设计,允许将 Ultralytics 软件无缝集成到商业产品中,而不受 AGPL-3.0 许可证的限制。

如何使用 Ultralytics YOLO 进行实时对象跟踪?

Ultralytics YOLO 支持高效且可定制的多对象跟踪。要使用跟踪功能,您可以使用 yolo track 命令,如下所示:

python 复制代码
from ultralytics import YOLO


#加载预训练模型

model = YOLO("yolo11n.pt")

#开始追踪视频中的物体,可以使用直播流或者摄像头输入

model.track(source="path/to/video.mp4")
相关推荐
顾道长生'5 小时前
(Arxiv-2025)通过动态 token 剔除实现无需训练的高效视频生成
计算机视觉·音视频·视频生成
shangyingying_19 小时前
关于小波降噪、小波增强、小波去雾的原理区分
人工智能·深度学习·计算机视觉
要努力啊啊啊10 小时前
YOLOv2 正负样本分配机制详解
人工智能·深度学习·yolo·计算机视觉·目标跟踪
Ailerx13 小时前
YOLOv13震撼发布:超图增强引领目标检测新纪元
人工智能·yolo·目标检测
BIYing_Aurora15 小时前
【IPMV】图像处理与机器视觉:Lec13 Robust Estimation with RANSAC
图像处理·人工智能·算法·计算机视觉
CHANG_THE_WORLD15 小时前
封装一个png的编码解码操作
图像处理·人工智能·计算机视觉
云天徽上16 小时前
【PaddleOCR】OCR常见关键信息抽取数据集,包含FUNSD、XFUND、WildReceipt等整理,持续更新中......
人工智能·计算机视觉·信息可视化·paddlepaddle·paddleocr·文本识别
lx74160269818 小时前
cd-agent更换cd模型(自用)
计算机视觉
慕婉030719 小时前
OpenCV图像边缘检测
人工智能·opencv·计算机视觉
埃菲尔铁塔_CV算法20 小时前
基于 TOF 图像高频信息恢复 RGB 图像的原理、应用与实现
人工智能·深度学习·数码相机·算法·目标检测·计算机视觉