YOLO简史

【欢迎关注编码小哥,学习更多实用的编程方法和技巧】

YOLO历史

YOLO (You Only Look Once) 是一种流行的对象检测和图像分割模型,由华盛顿大学的 Joseph Redmon 和 Ali Farhadi 开发。YOLO 于 2015 年推出,因其高速和准确性而迅速受到欢迎。

YOLOv2 于 2016 年发布,通过合并批量规范化、锚框和维度集群改进了原始模型。

YOLOv3 于 2018 年推出,使用更高效的主干网络、多个锚点和空间金字塔池进一步增强了模型的性能。

YOLOv4 于 2020 年发布,引入了 Mosaic 数据增强、新的无锚点检测头和新的损失函数等创新。

YOLOv5 进一步提高了模型的性能,并添加了新功能,例如超参数优化、集成实验跟踪和自动导出为流行的导出格式。

YOLOv6 由美团于 2022 年开源,并被用于该公司的许多自主送货机器人。

YOLOv7 添加了其他任务,例如对 COCO 关键点数据集进行姿态估计。

YOLOv8 由 Ultralytics 于 2023 年发布。YOLOv8 引入了新功能和改进,以增强性能、灵活性和效率,支持全方位的视觉 AI 任务。

YOLOv9 引入了可编程梯度信息 (PGI) 和广义高效层聚合网络 (GELAN) 等创新方法。

YOLOv10 由清华大学的研究人员使用 Ultralytics Python 包创建。此版本通过引入端到端头来提供实时对象检测改进,消除了非最大抑制 (NMS) 要求。

YOLO11 新功能:Ultralytics 的最新 YOLO 模型在多项任务(包括检测、分割、姿态估计、跟踪和分类)中提供最先进的 (SOTA) 性能,利用了各种 AI 应用程序和领域的功能。

常见问题

什么是 Ultralytics YOLO,它如何改进对象检测?

Ultralytics YOLO 是广受赞誉的 YOLO (You Only Look Once) 系列的最新进展,用于实时对象检测和图像分割。它基于以前的版本构建,引入了新功能和改进,以提高性能、灵活性和效率。YOLO 支持各种视觉 AI 任务,例如检测、分割、姿势估计、跟踪和分类。其最先进的架构确保了卓越的速度和准确性,使其适用于各种应用程序,包括边缘设备和云 API。

如何开始 YOLO 安装和设置?

YOLO 的入门既快速又简单。你可以使用 pip 安装 Ultralytics 软件包,并在几分钟内启动并运行。下面是一个基本的安装命令:

pip install ultralytics

如何在我的数据集上训练自定义 YOLO 模型?

在数据集上训练自定义 YOLO 模型涉及几个详细步骤:

准备带注释的数据集。

在 YAML 文件中配置训练参数。

使用 yolo TASK train 命令开始训练。(每个 TASK 都有自己的参数)

以下是对象检测任务的示例代码:

python 复制代码
from ultralytics import YOLO


# Load a pre-trained YOLO model (you can choose n, s, m, l, or x versions)

model = YOLO("yolo11n.pt")


# Start training on your custom dataset

model.train(data="path/to/dataset.yaml", epochs=100, imgsz=640)

Ultralytics YOLO 有哪些可用的许可选项?

Ultralytics 为 YOLO 提供两种许可选项:

AGPL-3.0 许可证:此开源许可证非常适合教育和非商业用途,促进开放式协作。

企业许可证:专为商业应用程序而设计,允许将 Ultralytics 软件无缝集成到商业产品中,而不受 AGPL-3.0 许可证的限制。

如何使用 Ultralytics YOLO 进行实时对象跟踪?

Ultralytics YOLO 支持高效且可定制的多对象跟踪。要使用跟踪功能,您可以使用 yolo track 命令,如下所示:

python 复制代码
from ultralytics import YOLO


#加载预训练模型

model = YOLO("yolo11n.pt")

#开始追踪视频中的物体,可以使用直播流或者摄像头输入

model.track(source="path/to/video.mp4")
相关推荐
Struart_R1 小时前
SpatialVLM和SpatialRGPT论文解读
计算机视觉·语言模型·transformer·大语言模型·vlm·视觉理解·空间推理
软件测试-阿涛4 小时前
【AI绘画】Stable Diffusion webUI 常用功能使用技巧
人工智能·深度学习·计算机视觉·ai作画·stable diffusion
荼蘼7 小时前
OpenCv(二)——边界填充、阈值处理
人工智能·opencv·计算机视觉
思通数据13 小时前
AI视频监控:重构安防行业智能化新生态
人工智能·安全·目标检测·机器学习·计算机视觉·重构·数据挖掘
CV实验室19 小时前
ICCV 2025 | 4相机干掉480机位?CMU MonoFusion高斯泼溅重构4D人体!
人工智能·数码相机·计算机视觉·论文
星期天要睡觉21 小时前
计算机视觉(opencv)实战三——图像运算、cv2.add()、cv2.addWeighted()
人工智能·opencv·计算机视觉
WeiJingYu.1 天前
计算机视觉Open-CV
人工智能·opencv·计算机视觉
钓了猫的鱼儿1 天前
无人机航拍数据集|第14期 无人机水体污染目标检测YOLO数据集3000张yolov11/yolov8/yolov5可训练
yolo·目标检测·猫脸码客·yolo数据集·无人机航拍数据集·无人机水体污染目标检测
爆改模型1 天前
【AAAI2025】计算机视觉|即插即用|TBSN:颠覆性盲点模块!Transformer加持,图像去噪性能炸裂!
人工智能·计算机视觉·transformer
小关会打代码1 天前
计算机视觉第一课opencv(二)保姆级教
人工智能·opencv·计算机视觉