【论文阅读】YOLOv10: Real-Time End-to-End Object Detection

题目 :YOLOv10: Real-Time End-to-End Object Detection
作者 :Ao Wang Hui Chen∗ Lihao Liu Kai Chen Zijia Lin Jungong Han Guiguang Ding∗

清华大学的

motivation: 作者觉得YOLO系列的NMS和某些结构非常的耗时,提出NMS-free和一些列高效和低算力消耗的yolov-10.

methods:

**NMS-free:**作者设计了2个lables assignments, one-to-one & one-to-many 两个标签分配策略。作者在训练的时候同事监督训练两个策略,在推理的时候用one-to-one,实现nms-free。 同时使用一些列的策略

来实现训练的时候one-to-one & one-to-many 的分配和计算,使one-to-one获得one-to-many最佳的效果。

一些列高效的模型

包括:轻量化分类头、空间通道解耦的下采样、层级模块设计、采用大卷积核、部分的自注意力机制 等。使模型更鲁棒;

experiments:

实验显示模型又快又好!值得推荐。

相关推荐
大模型最新论文速读9 小时前
05-15 · LLM 最新论文速览
论文阅读·人工智能·深度学习·机器学习·自然语言处理
数智工坊9 小时前
【DINOv2论文阅读】:无需监督的通用视觉特征提取器——机器人VLA模型的“眼睛“基石
论文阅读·人工智能·深度学习·计算机视觉·transformer
jay神12 小时前
基于YOLOv8的交通标志识别Web系统
前端·人工智能·深度学习·yolo·机器学习·毕业设计
与仪共舞13 小时前
安捷伦3458A多功能数字万用表
目标检测·机器学习
我材不敲代码14 小时前
目标检测:YOLOv12环境配置,全文详细教程
人工智能·yolo·目标检测
断眉的派大星15 小时前
目标检测中的区域建议(Region Proposal):高效候选框初筛
人工智能·目标检测·目标跟踪
想七想八不如1140815 小时前
markdown笔记(没找到合适笔记软件,暂存)
笔记·目标检测
数智工坊16 小时前
【SigLIP论文阅读】:重新定义视觉-语言预训练的损失函数——VLA模型的“语言理解“基石
论文阅读·人工智能·算法·计算机视觉·语言模型
深度学习lover16 小时前
<数据集>yolo 易拉罐识别<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·易拉罐识别