YOLO26 正式发布!6 大任务一战封神,n 模型 mAP 40.9 跑 1.7ms,从检测到分割到姿态一条龙

YOLO26 正式发布!6 大任务一战封神,n 模型 mAP 40.9 跑 1.7ms,从检测到分割到姿态一条龙

💡 目标检测选 YOLO,实例分割还是 YOLO,姿态估计也是 YOLO------Ultralytics 一手打造了 CV 界的"万能瑞士军刀"。YOLO26 全系模型已上线:5 档尺寸覆盖 n/s/m/l/x,目标检测、实例分割、语义分割、图像分类、姿态估计、旋转框检测 6 大任务一个框架全搞定。YOLO26n 检测 mAP 40.9、推理仅 1.7ms,YOLO26x 检测 mAP 57.5------又快又准的新王者!

📌 目录

  • [1. Ultralytics YOLO 是什么?](#1. Ultralytics YOLO 是什么?)
  • [2. YOLO26 全系模型性能](#2. YOLO26 全系模型性能)
  • [3. 三行代码跑起来](#3. 三行代码跑起来)
  • [4. 6 大任务详解](#4. 6 大任务详解)
  • [5. 模型选型指南](#5. 模型选型指南)
  • [6. 部署导出](#6. 部署导出)
  • [7. 生态集成](#7. 生态集成)
  • [8. 许可证与商用](#8. 许可证与商用)
  • [9. 优缺点与踩坑经验](#9. 优缺点与踩坑经验)
  • [10. 总结](#10. 总结)

1. Ultralytics YOLO 是什么?

Ultralytics YOLO 是由 Ultralytics 团队开发的最先进的计算机视觉框架 ,基于多年 CV 基础研究持续迭代。从 YOLOv3 到最新的 YOLO26,一直是目标检测领域的速度-精度标杆。

一框架搞定 6 大任务

任务 说明 典型场景
🎯 目标检测 检测并定位图中物体 安防监控、自动驾驶、工业质检
🏷️ 实例分割 像素级分割每个实例 医学影像、机器人抓取
🎨 语义分割 像素级分类每个区域 自动驾驶场景理解、遥感
📊 图像分类 整图分类 内容审核、商品识别
🧘 姿态估计 人体关键点检测 健身 APP、运动分析
🔄 旋转框检测 (OBB) 检测任意角度目标 遥感图像、航空检测

2. YOLO26 全系模型性能

🎯 目标检测(COCO val2017)

模型 mAP 50-95 mAP 50-95 (e2e) CPU ONNX (ms) T4 TensorRT (ms) 参数量 (M) FLOPs (B)
YOLO26n 40.9 40.1 38.9 1.7 2.4 5.4
YOLO26s 48.6 47.8 87.2 2.5 9.5 20.7
YOLO26m 53.1 52.5 220.0 4.7 20.4 68.2
YOLO26l 55.0 54.4 286.2 6.2 24.8 86.4
YOLO26x 57.5 🏆 56.9 525.8 11.8 55.7 193.9

💡 YOLO26n 仅 2.4M 参数,T4 推理 1.7ms ,嵌入式设备首选!

💡 YOLO26x mAP 57.5,精度王者,服务器部署首选!

🏷️ 实例分割(COCO-Seg)

模型 mAP-box (e2e) mAP-mask (e2e) T4 TensorRT (ms) 参数量 (M)
YOLO26n-seg 39.6 33.9 2.1 2.7
YOLO26s-seg 47.3 40.0 3.3 10.4
YOLO26m-seg 52.5 44.1 6.7 23.6
YOLO26l-seg 54.4 45.5 8.0 28.0
YOLO26x-seg 56.5 47.0 16.4 62.8

🎨 语义分割(Cityscapes)

模型 mIoU RTX3090 速度 (ms) 参数量 (M)
YOLO26n-sem 78.3 4.4 1.6
YOLO26s-sem 80.8 8.4 6.5
YOLO26m-sem 82.0 19.9 14.3
YOLO26l-sem 82.9 26.5 17.9
YOLO26x-sem 83.6 48.9 40.2

📊 图像分类(ImageNet)

模型 Top-1 Acc Top-5 Acc T4 TensorRT (ms) 参数量 (M)
YOLO26n-cls 71.4 90.1 1.1 2.8
YOLO26s-cls 76.0 92.9 1.3 6.7
YOLO26m-cls 78.1 94.2 2.0 11.6
YOLO26l-cls 79.0 94.6 2.8 14.1
YOLO26x-cls 79.9 95.0 3.8 29.6

🧘 姿态估计(COCO-Pose)

模型 mAP-pose (e2e) mAP-pose50 (e2e) T4 TensorRT (ms) 参数量 (M)
YOLO26n-pose 57.2 83.3 1.8 2.9
YOLO26s-pose 63.0 86.6 2.7 10.4
YOLO26m-pose 68.8 89.6 5.0 21.5
YOLO26l-pose 70.4 90.5 6.5 25.9
YOLO26x-pose 71.6 91.6 12.2 57.6

🔄 旋转框检测(DOTAv1)

模型 mAP 50-95 (e2e) mAP 50 (e2e) T4 TensorRT (ms) 参数量 (M)
YOLO26n-obb 52.4 78.9 2.8 2.5
YOLO26s-obb 54.8 80.9 4.9 9.8
YOLO26m-obb 55.3 81.0 10.2 21.2
YOLO26l-obb 56.2 81.6 13.0 25.6
YOLO26x-obb 56.7 81.7 30.5 57.6

3. 三行代码跑起来

安装

bash 复制代码
pip install ultralytics

其他安装方式:

bash 复制代码
# Conda
conda install -c conda-forge ultralytics

# Docker
docker pull ultralytics/ultralytics

# 从源码
git clone https://github.com/ultralytics/ultralytics
pip install -e ultralytics

CLI 使用

bash 复制代码
# 目标检测
yolo predict model=yolo26n.pt source='https://ultralytics.com/images/bus.jpg'

# 训练
yolo train model=yolo26n.pt data=coco8.yaml epochs=100 imgsz=640

# 验证
yolo val model=yolo26n.pt data=coco.yaml

Python 使用

python 复制代码
from ultralytics import YOLO

# 1. 加载模型
model = YOLO("yolo26n.pt")

# 2. 训练
model.train(data="coco8.yaml", epochs=100, imgsz=640, device="cpu")

# 3. 验证
metrics = model.val()

# 4. 推理
results = model("path/to/image.jpg")
results[0].show()

# 5. 导出
path = model.export(format="onnx")

就这么简单! 统一的 API 设计,换模型只需改一行 YOLO("yolo26s.pt")


4. 6 大任务详解

🎯 目标检测

最经典、最广泛使用的 YOLO 任务。输入图片 → 输出边界框 + 类别 + 置信度。

python 复制代码
model = YOLO("yolo26n.pt")
results = model("bus.jpg")

for result in results:
    boxes = result.boxes
    for box in boxes:
        print(f"类别: {box.cls}, 置信度: {box.conf}, 坐标: {box.xyxy}")

🏷️ 实例分割

在检测基础上增加像素级掩码,区分同一类别的不同实例。

python 复制代码
model = YOLO("yolo26n-seg.pt")
results = model("bus.jpg")

for result in results:
    masks = result.masks  # 掩码
    boxes = result.boxes  # 检测框

🎨 语义分割

对每个像素分类,不区分实例。适合场景理解。

python 复制代码
model = YOLO("yolo26n-sem.pt")
results = model("cityscape.jpg")

for result in results:
    probs = result.probs  # 语义概率图

📊 图像分类

整图分类,输出类别概率分布。

python 复制代码
model = YOLO("yolo26n-cls.pt")
results = model("cat.jpg")

for result in results:
    top5 = result.probs.top5  # Top-5 类别

🧘 姿态估计

检测人体关键点(17 个 COCO 关键点),可用于动作识别、健身辅助。

python 复制代码
model = YOLO("yolo26n-pose.pt")
results = model("person.jpg")

for result in results:
    keypoints = result.keypoints  # 关键点坐标 + 置信度

🔄 旋转框检测 (OBB)

检测任意角度的目标,输出旋转边界框。遥感、航拍必备。

python 复制代码
model = YOLO("yolo26n-obb.pt")
results = model("satellite.jpg")

for result in results:
    obb = result.obb  # 旋转框
    for b in obb:
        print(f"旋转框: {b.xywhr}")  # cx, cy, w, h, angle

🔍 目标跟踪

检测 + 跟踪,支持 BoT-SORT 和 ByteTrack。

python 复制代码
model = YOLO("yolo26n.pt")
results = model.track(source="video.mp4", show=True)

5. 模型选型指南

按场景选模型

场景 推荐模型 理由
📱 移动端/嵌入式 YOLO26n 2.4M 参数,1.7ms 推理
🚀 实时服务 YOLO26s 精度-速度最佳平衡
⚖️ 通用场景 YOLO26m 53.1 mAP,4.7ms,性能够用
🔬 高精度需求 YOLO26l 55.0 mAP,工业级精度
🏆 极致精度 YOLO26x 57.5 mAP,服务器部署

按任务选后缀

任务 模型后缀 示例
目标检测 无后缀 yolo26n.pt
实例分割 -seg yolo26n-seg.pt
语义分割 -sem yolo26n-sem.pt
图像分类 -cls yolo26n-cls.pt
姿态估计 -pose yolo26n-pose.pt
旋转框检测 -obb yolo26n-obb.pt

精度-速度权衡图(检测任务)

复制代码
精度 ↑
57.5 ┤                                          ★ YOLO26x
55.0 ┤                               ★ YOLO26l
53.1 ┤                    ★ YOLO26m
48.6 ┤         ★ YOLO26s
40.9 ┤ ★ YOLO26n
     └──┬────┬────┬────┬────┬────┬────┬──→ 速度 (T4 ms)
       1.7  2.5  4.7  6.2  11.8

6. 部署导出

Ultralytics 支持一键导出多种格式:

python 复制代码
model = YOLO("yolo26n.pt")

# 导出 ONNX
model.export(format="onnx")

# 导出 TensorRT(GPU 部署首选)
model.export(format="engine")

# 导出 Core ML(iOS 部署)
model.export(format="coreml")

# 导出 TFLite(Android 部署)
model.export(format="tflite")

# 导出 OpenVINO(Intel 推理)
model.export(format="openvino")
格式 后缀 适用场景
ONNX .onnx 通用跨平台推理
TensorRT .engine NVIDIA GPU 极速推理
Core ML .mlpackage iOS/macOS 部署
TFLite .tflite Android / 嵌入式
OpenVINO .xml Intel CPU/GPU/VPU
NCNN .param 移动端轻量推理
GGUF .gguf 量化部署

7. 生态集成

Ultralytics 与主流 AI 平台深度集成:

平台 功能
Weights & Biases 实验追踪、超参搜索、可视化
Comet ML 实验管理、模型对比
Roboflow 数据标注、数据集管理
Intel OpenVINO Intel 硬件加速推理
ClearML MLOps 流水线
Ultralytics HUB 一站式训练、部署、管理

Ultralytics HUB

Ultralytics HUB 是官方一站式平台:

  • 🖱️ 零代码训练模型
  • 📊 可视化训练监控
  • 📱 一键部署到边缘设备
  • 🔄 数据集版本管理

8. 许可证与商用

Ultralytics 提供双许可证模式:

许可证 适用 说明
AGPL-3.0 学生、研究者、爱好者 OSI 认证开源,要求衍生作品同样开源
Enterprise License 企业商用 允许闭源商业使用,无需公开代码

⚠️ 如果你的产品使用 Ultralytics YOLO 且不打算开源,必须购买 Enterprise License 。详见 Ultralytics Licensing


9. 优缺点与踩坑经验

✅ 优点

维度 评分 说明
精度 ⭐⭐⭐⭐⭐ YOLO26x 检测 mAP 57.5,全任务 SOTA
速度 ⭐⭐⭐⭐⭐ YOLO26n T4 仅 1.7ms,极致速度
易用性 ⭐⭐⭐⭐⭐ pip install + 三行代码,统一 API
任务覆盖 ⭐⭐⭐⭐⭐ 6 大任务 + 跟踪,一个框架全覆盖
部署 ⭐⭐⭐⭐⭐ 一键导出 ONNX/TensorRT/TFLite/Core ML 等
文档 ⭐⭐⭐⭐⭐ 官方文档 + 教程 + 示例,非常完善
社区 ⭐⭐⭐⭐⭐ 36K+ Star,Discord/Reddit/论坛活跃

⚠️ 注意事项

事项 说明
AGPL-3.0 商用需购买 Enterprise License
模型自动下载 首次使用会自动从 GitHub Release 下载权重,需联网
显存需求 YOLO26x 训练需较大显存(建议 24GB+)
数据集格式 需使用 Ultralytics YAML 格式,需从 COCO/VOC 转换
跟踪稳定性 复杂场景下跟踪 ID 可能跳变,需调参

10. 总结

Ultralytics YOLO 是计算机视觉领域的事实标准------没有之一:

  • 🏆 6 大任务全覆盖:检测 / 分割 / 语义分割 / 分类 / 姿态 / 旋转框 + 跟踪
  • 极致速度:YOLO26n T4 推理 1.7ms,嵌入式设备可用
  • 🎯 SOTA 精度:YOLO26x 检测 mAP 57.5,各任务均达顶尖水平
  • 🛠️ 极简 APIpip install + 三行代码,统一接口换模型只需改一行
  • 🚀 一键部署:ONNX / TensorRT / Core ML / TFLite / OpenVINO / NCNN
  • 🌐 生态丰富:W&B / Comet / Roboflow / HUB 深度集成

推荐指数:⭐⭐⭐⭐⭐

无论你是 CV 初学者还是资深工程师,Ultralytics YOLO 都是目前最值得掌握的视觉框架。从研究到生产,从手机到服务器,一套 API 打通全链路。

📢 项目地址:https://github.com/ultralytics/ultralytics

📖 官方文档:https://docs.ultralytics.com


标签:#YOLO #Ultralytics #目标检测 #深度学习 #计算机视觉 #YOLO26

相关推荐
韩师傅6 天前
海天线算法的前世今生
python·计算机视觉
韩师傅6 天前
当你的甲方设备过烂,要如何快速出效果?
python·计算机视觉
韩师傅6 天前
当你的甲方吐槽天空不够蓝,你应该如何应对
python·计算机视觉
兵慌码乱13 天前
基于 MediaPipe 与 PySide2 的手势交互音乐控制系统实现:轻量化视觉交互全流程解析
python·opencv·计算机视觉·人机交互·手势识别·mediapipe·pyside2
小小杨树15 天前
读懂色彩:拍照调色不再难
算法·计算机视觉·配色
H__Rick17 天前
自动对焦学习-3
人工智能·学习·计算机视觉
计算机科研狗@OUC17 天前
(cvpr26) AIMDepth: Asymmetric Image-Event Mamba for Monocular Depth Estimation
人工智能·深度学习·计算机视觉
qq_3665665017 天前
2026最新:5款AI视频口型同步工具实测横评,视频翻译后嘴型对不上的终极解决方案
人工智能·计算机视觉·新媒体运营
梦想三三17 天前
OpenCV银行卡数字识别项目(图像预处理与字符分割)
人工智能·opencv·计算机视觉