【论文阅读】YOLOv10: Real-Time End-to-End Object Detection

题目 :YOLOv10: Real-Time End-to-End Object Detection
作者 :Ao Wang Hui Chen∗ Lihao Liu Kai Chen Zijia Lin Jungong Han Guiguang Ding∗

清华大学的

motivation: 作者觉得YOLO系列的NMS和某些结构非常的耗时,提出NMS-free和一些列高效和低算力消耗的yolov-10.

methods:

**NMS-free:**作者设计了2个lables assignments, one-to-one & one-to-many 两个标签分配策略。作者在训练的时候同事监督训练两个策略,在推理的时候用one-to-one,实现nms-free。 同时使用一些列的策略

来实现训练的时候one-to-one & one-to-many 的分配和计算,使one-to-one获得one-to-many最佳的效果。

一些列高效的模型

包括:轻量化分类头、空间通道解耦的下采样、层级模块设计、采用大卷积核、部分的自注意力机制 等。使模型更鲁棒;

experiments:

实验显示模型又快又好!值得推荐。

相关推荐
小雪狼4 小时前
RV1126 RKNN环境搭建记录
rnn·yolo
m0_743106465 小时前
NeRF+3DGS——提升渲染质量与压缩模型参数
论文阅读·人工智能·计算机视觉·3d·几何学
nju_spy6 小时前
计算机视觉 - 物体检测(二)单阶段:YOLO系列 + SSD
人工智能·yolo·目标检测·计算机视觉·ssd·r-cnn·端到端检测
码猩7 小时前
YOLO通用无人机目标检测框架
人工智能·yolo·目标检测
Hcoco_me8 小时前
YOLO入门教程(番外):计算机视觉数学、编程基础
人工智能·yolo·计算机视觉
红苕稀饭6661 天前
Koala论文阅读
论文阅读
CV-杨帆1 天前
论文阅读:硕士学位论文 2025 面向大语言模型的黑盒对抗性攻击与防御关键技术研究
论文阅读·人工智能·语言模型
berling001 天前
【论文阅读 | WACV 2025 | MCOR:通过跨模态信息互补和余弦相似性通道重采样模块增强的多光谱目标检测】
论文阅读·人工智能·目标检测
Purple Coder1 天前
论文阅读-9月27日(入门1)
论文阅读
CV-杨帆1 天前
论文阅读:NeurIPS 2024 LLM Evaluators Recognize and Favor Their Own Generations
论文阅读