YOLO26:全新的视觉模型来了

1 前言

讲道理,YOLO26开源已经有几天了,今天来说YOLO26属实是有些姗姗来迟。

不过好饭不怕晚,目前,计算机视觉的发展诉求越来越不局限于实验室,而是要求从云端下沉到终端设备。当下视觉模型的发展,对于更快的速度,更高的精度提出了更加严格的要求。

而YOLO26就是为下一代计算机视觉而生的,由于YOLO26性能的提升,部署流程的简化以及模型功能的扩展,使得它进一步满足了行业的核心诉求。

Ultralytics创始人兼CEO Glenn Jocher在发布会上强调,希望最顶尖的AI技术不被大型企业垄断,而是能够走进千家万户,希望让AI能走进每个人的生活------从手机到交通工具,从低功耗设备到边缘终端,让所有解决方案开发者都能轻松获取强大的计算机视觉能力。

YOLO26依然延续了Ultralytics YOLO方便简洁易上手的特点,使得模型能丝滑切入各种工作,指出诸如分类、检测、分割以及姿态估计等典型计算机视觉任务,并且在本地设备、摄像头、嵌入式设备以及机器人系统中能够高效运行,节约了计算资源。

2 创新点所在

  • DFL 移除:

YOLO早期的模型依赖分布焦点损失,YOLO26采用更简洁的结构,直接删除了DFL模块,简化了边界框预测流程,提升了硬件兼容性,使得模型适合在边缘设备和低算力平台运行。

  • 端到端无NMS推理:

消除NMS,不再需要过滤重叠预测框,支持端到端推理,实现更快、更简单的部署,降低了推理复杂度,完美契合边缘场景。

  • ProgLoss + STAL:

指的是渐进式损失平衡和小目标感知标签分配。第一点使得模型训练更加平稳,收敛更加平滑,稳定了训练过程。第二点在针对小目标问题上,使得YOLO26在复杂场景中,依然保持高敏感度。二者结合起来,进一步突破了YOLO适用场景的限制。

  • MuSGD Optimizer:

受大模型训练的启发,结合 SGD 和 Muon(灵感来自 Moonshot 的 Kimi K2),采用全新的混合优化器,训练更加稳定、高效。

  • CPU 推理速度提高高达 43%:

剑指边缘设备,间距高速度和高精度,使得边缘设备也能够实时处理视觉数据,提升了实时检测性能,解放了云端依赖。

YOLO26在视觉场景上应用广泛,如在机器人、无人机、制造业以及嵌入式设备中被批量部署。

在机器人领域,可以实现机器人的导航、安全运行、以及物体交互等任务;

在无人机领域,YOLO26可实时处理航空影像,完成检测、地质勘探和测绘等任务;

在制造业领域,提高图像和视频分析正确率,降低云端依赖,同时可以本地实时处理;

在嵌入式领域,可在低功耗单板上运行,在本地就可以完成视觉图像处理,降低云端依赖,常用设备有诸如只能摄像头、物联网传感器以及自动化监控设备等。

3 快速上手YOLO26

YOLO26的使用地址:

https://platform.ultralytics.com/ultralytics/yolo26

和之前的YOLO模型类似,YOLO26依然支持两种方式:

  • 通过Ultralytics 平台下载代码:

YOLO26的代码连接:

https://github.com/ultralytics/ultralytics

下载代码后,用户可集中训练自己的模型和数据集。

首先需要安装好对应的库:

复制代码
pip install ultralytics

直接预测:

复制代码
yolo predict model=yolo26n.pt source='https://ultralytics.com/images/bus.jpg'
  • 通过开源工作流使用 YOLO26

通过Ultralytics 开源生态系统完全访问,在安装好Ultralytics后,加载预训练的YOLO26模型,直接进行部署:

复制代码
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
train_results = model.train(
    data="coco8.yaml",  # Path to dataset configuration file
    epochs=100,  # Number of training epochs
    imgsz=640,  # Image size for training
    device="cpu",  # Device to run on (e.g., 'cpu', 0, [0,1,2,3])
)
metrics = model.val()
Perform object detection on an image
results = model("path/to/image.jpg")  
results[0].show()  # Display results
path = model.export(format="onnx") 

完整教程:

https://docs.ultralytics.com/

2024年,Ultralytics团队同时推出YOLO11和YOLO26两大模型,两颗双星在技术的竞技场上各有所长。

YOLO11凭借精妙的架构设计以及卓越的检测精度,将通用目标检测推向了新的技术高度;

而YOLO26则朝着边缘计算和部署效率一路狂飙,为低功耗设备视觉处理开启了全新的篇章。

两大模型的同期问世,Ultralytics团队名不虚传,为整个行业提供了两个面向不同需求的技术路径:YOLO11夯实理论优势,YOLO26则追求效率至上。

欢迎大家关注我的gzh:阿龙AI日记

相关推荐
AI技术增长34 分钟前
Pytorch图像去噪实战(六):CBDNet真实噪声去噪实战,解决合成噪声模型落地效果差的问题
pytorch·深度学习·机器学习
小糖学代码2 小时前
LLM系列:2.pytorch入门:8.神经网络的损失函数(criterion)
人工智能·深度学习·神经网络
Jmayday2 小时前
Pytorch:RNN理论基础
pytorch·rnn·深度学习
AI周红伟4 小时前
周红伟:GPT-Image-2深度解析:从技术原理到实战教程,为什么它能让整个AI圈炸锅?
人工智能·gpt·深度学习·机器学习·语言模型·openclaw
端平入洛5 小时前
梯度是什么:PyTorch 自动求导详解
人工智能·深度学习
Uopiasd1234oo5 小时前
上下文引导模块改进YOLOv26局部与全局特征融合能力双重提升
深度学习·yolo·机器学习
懷淰メ7 小时前
【AI加持】基于PyQt+YOLO+DeepSeek的钢材焊接缺陷检测系统(详细介绍)
yolo·目标检测·计算机视觉·pyqt·缺陷检测·deepseek·钢材缺陷
动物园猫7 小时前
工业织物缺陷目标检测数据集分享(适用于YOLO系列深度学习分类检测任务)
深度学习·yolo·目标检测
ACCELERATOR_LLC7 小时前
【DataWhale组队学习】DIY-LLM Task6 评估与基准测试
人工智能·深度学习·大模型·模型评估
狮子座明仔8 小时前
ThinkTwice: 让模型学会“做完题再检查一遍“,推理+自纠错联合训练只加3%开销
大数据·人工智能·深度学习