【论文阅读】YOLOv10: Real-Time End-to-End Object Detection

一碗白开水一2024-08-14 11:29

题目：YOLOv10: Real-Time End-to-End Object Detection
作者：Ao Wang Hui Chen∗ Lihao Liu Kai Chen Zijia Lin Jungong Han Guiguang Ding∗

清华大学的

motivation: 作者觉得YOLO系列的NMS和某些结构非常的耗时，提出NMS-free和一些列高效和低算力消耗的yolov-10.

methods:

**NMS-free：**作者设计了2个lables assignments, one-to-one & one-to-many 两个标签分配策略。作者在训练的时候同事监督训练两个策略，在推理的时候用one-to-one，实现nms-free。同时使用一些列的策略

来实现训练的时候one-to-one & one-to-many 的分配和计算，使one-to-one获得one-to-many最佳的效果。

一些列高效的模型 ：

包括：轻量化分类头、空间通道解耦的下采样、层级模块设计、采用大卷积核、部分的自注意力机制等。使模型更鲁棒；

experiments:

实验显示模型又快又好！值得推荐。