YOLO26:全新的视觉模型来了

1 前言

讲道理,YOLO26开源已经有几天了,今天来说YOLO26属实是有些姗姗来迟。

不过好饭不怕晚,目前,计算机视觉的发展诉求越来越不局限于实验室,而是要求从云端下沉到终端设备。当下视觉模型的发展,对于更快的速度,更高的精度提出了更加严格的要求。

而YOLO26就是为下一代计算机视觉而生的,由于YOLO26性能的提升,部署流程的简化以及模型功能的扩展,使得它进一步满足了行业的核心诉求。

Ultralytics创始人兼CEO Glenn Jocher在发布会上强调,希望最顶尖的AI技术不被大型企业垄断,而是能够走进千家万户,希望让AI能走进每个人的生活------从手机到交通工具,从低功耗设备到边缘终端,让所有解决方案开发者都能轻松获取强大的计算机视觉能力。

YOLO26依然延续了Ultralytics YOLO方便简洁易上手的特点,使得模型能丝滑切入各种工作,指出诸如分类、检测、分割以及姿态估计等典型计算机视觉任务,并且在本地设备、摄像头、嵌入式设备以及机器人系统中能够高效运行,节约了计算资源。

2 创新点所在

  • DFL 移除:

YOLO早期的模型依赖分布焦点损失,YOLO26采用更简洁的结构,直接删除了DFL模块,简化了边界框预测流程,提升了硬件兼容性,使得模型适合在边缘设备和低算力平台运行。

  • 端到端无NMS推理:

消除NMS,不再需要过滤重叠预测框,支持端到端推理,实现更快、更简单的部署,降低了推理复杂度,完美契合边缘场景。

  • ProgLoss + STAL:

指的是渐进式损失平衡和小目标感知标签分配。第一点使得模型训练更加平稳,收敛更加平滑,稳定了训练过程。第二点在针对小目标问题上,使得YOLO26在复杂场景中,依然保持高敏感度。二者结合起来,进一步突破了YOLO适用场景的限制。

  • MuSGD Optimizer:

受大模型训练的启发,结合 SGD 和 Muon(灵感来自 Moonshot 的 Kimi K2),采用全新的混合优化器,训练更加稳定、高效。

  • CPU 推理速度提高高达 43%:

剑指边缘设备,间距高速度和高精度,使得边缘设备也能够实时处理视觉数据,提升了实时检测性能,解放了云端依赖。

YOLO26在视觉场景上应用广泛,如在机器人、无人机、制造业以及嵌入式设备中被批量部署。

在机器人领域,可以实现机器人的导航、安全运行、以及物体交互等任务;

在无人机领域,YOLO26可实时处理航空影像,完成检测、地质勘探和测绘等任务;

在制造业领域,提高图像和视频分析正确率,降低云端依赖,同时可以本地实时处理;

在嵌入式领域,可在低功耗单板上运行,在本地就可以完成视觉图像处理,降低云端依赖,常用设备有诸如只能摄像头、物联网传感器以及自动化监控设备等。

3 快速上手YOLO26

YOLO26的使用地址:

https://platform.ultralytics.com/ultralytics/yolo26

和之前的YOLO模型类似,YOLO26依然支持两种方式:

  • 通过Ultralytics 平台下载代码:

YOLO26的代码连接:

https://github.com/ultralytics/ultralytics

下载代码后,用户可集中训练自己的模型和数据集。

首先需要安装好对应的库:

复制代码
pip install ultralytics

直接预测:

复制代码
yolo predict model=yolo26n.pt source='https://ultralytics.com/images/bus.jpg'
  • 通过开源工作流使用 YOLO26

通过Ultralytics 开源生态系统完全访问,在安装好Ultralytics后,加载预训练的YOLO26模型,直接进行部署:

复制代码
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
train_results = model.train(
    data="coco8.yaml",  # Path to dataset configuration file
    epochs=100,  # Number of training epochs
    imgsz=640,  # Image size for training
    device="cpu",  # Device to run on (e.g., 'cpu', 0, [0,1,2,3])
)
metrics = model.val()
Perform object detection on an image
results = model("path/to/image.jpg")  
results[0].show()  # Display results
path = model.export(format="onnx") 

完整教程:

https://docs.ultralytics.com/

2024年,Ultralytics团队同时推出YOLO11和YOLO26两大模型,两颗双星在技术的竞技场上各有所长。

YOLO11凭借精妙的架构设计以及卓越的检测精度,将通用目标检测推向了新的技术高度;

而YOLO26则朝着边缘计算和部署效率一路狂飙,为低功耗设备视觉处理开启了全新的篇章。

两大模型的同期问世,Ultralytics团队名不虚传,为整个行业提供了两个面向不同需求的技术路径:YOLO11夯实理论优势,YOLO26则追求效率至上。

欢迎大家关注我的gzh:阿龙AI日记

相关推荐
m沐沐5 分钟前
【深度学习】PyTorch CNN 手写数字识别(卷积神经网络)
人工智能·pytorch·python·深度学习·机器学习·pycharm·cnn
San813_LDD7 分钟前
[深度学习]Promot标题预测实战:来自DeepSeek的心路历程分析
人工智能·深度学习
王莎莎-MinerU18 分钟前
从 OCR 到 Context Engineering:用 MinerU 搭一个可复现文档解析评测
人工智能·深度学习·机器学习·pdf·ocr·个人开发
叫我:松哥18 分钟前
基于卷积神经网络的静态手势语识别算法,在测试集上的识别准确率达到97.5%
人工智能·python·深度学习·神经网络·算法·cnn
虎妞050020 分钟前
PyTorch 2.0 生产级部署与性能优化指南
pytorch·深度学习·ai·模型部署·cuda
独自归家的兔21 分钟前
Claude Fable 5 与 Claude Mythos 5 全面解析及定价策略分析
人工智能·深度学习
YOLO数据集集合24 分钟前
智能道路病害识别 公路巡检深度学习数据集实战 | 路面缺陷检测 无人机视觉 道路养护AI方案10299期
人工智能·深度学习·目标检测·无人机
AI浩31 分钟前
【模型改进】SBA 改进 YOLO 系列:用选择性边界聚合替换 Concat,增强 VisDrone 多尺度小目标检测
人工智能·yolo·目标检测
月疯42 分钟前
torch:transpose和permute的用法
人工智能·pytorch·深度学习
2401_8856651943 分钟前
从零搭建卷积神经网络:基于PyTorch实现MNIST手写数字分类
pytorch·python·神经网络·算法·机器学习·分类·cnn