【论文阅读】YOLOv10: Real-Time End-to-End Object Detection

题目 :YOLOv10: Real-Time End-to-End Object Detection
作者 :Ao Wang Hui Chen∗ Lihao Liu Kai Chen Zijia Lin Jungong Han Guiguang Ding∗

清华大学的

motivation: 作者觉得YOLO系列的NMS和某些结构非常的耗时,提出NMS-free和一些列高效和低算力消耗的yolov-10.

methods:

**NMS-free:**作者设计了2个lables assignments, one-to-one & one-to-many 两个标签分配策略。作者在训练的时候同事监督训练两个策略,在推理的时候用one-to-one,实现nms-free。 同时使用一些列的策略

来实现训练的时候one-to-one & one-to-many 的分配和计算,使one-to-one获得one-to-many最佳的效果。

一些列高效的模型

包括:轻量化分类头、空间通道解耦的下采样、层级模块设计、采用大卷积核、部分的自注意力机制 等。使模型更鲁棒;

experiments:

实验显示模型又快又好!值得推荐。

相关推荐
万里鹏程转瞬至14 小时前
开源项目分析:wan2.1 VACE 关键设计与实现代码解读
论文阅读·aigc
叶凡要飞15 小时前
RTX5060Ti安装双系统ubuntu22.04各种踩坑点(黑屏,引导区修复、装驱动、server版本安装)
人工智能·python·yolo·ubuntu·机器学习·操作系统
红苕稀饭66617 小时前
PVC论文阅读
论文阅读
CoookeCola17 小时前
MovieNet(A holistic dataset for movie understanding) :面向电影理解的多模态综合数据集与工具链
数据仓库·人工智能·目标检测·计算机视觉·数据挖掘
菜鸟‍17 小时前
【论文学习】大语言模型(LLM)论文
论文阅读·人工智能·学习
何如千泷21 小时前
【论文阅读】PathMR: Multimodal Visual Reasoning for Interpretable Pathology Analysis
论文阅读·医学图像分割·病理
FL162386312921 小时前
无人机视角河道多目标垃圾检测数据集VOC+YOLO格式1736张6类别
yolo·无人机
XIAO·宝1 天前
深度学习------YOLOV1和YOLOV2
人工智能·深度学习·yolo
禾昂.1 天前
从 YOLO V1 到 V2:目标检测领域的一次关键技术迭代
yolo·目标检测·目标跟踪
依夏c1 天前
FACT-AUDIT
论文阅读·论文笔记