【论文阅读】YOLOv10: Real-Time End-to-End Object Detection

题目 :YOLOv10: Real-Time End-to-End Object Detection
作者 :Ao Wang Hui Chen∗ Lihao Liu Kai Chen Zijia Lin Jungong Han Guiguang Ding∗

清华大学的

motivation: 作者觉得YOLO系列的NMS和某些结构非常的耗时,提出NMS-free和一些列高效和低算力消耗的yolov-10.

methods:

**NMS-free:**作者设计了2个lables assignments, one-to-one & one-to-many 两个标签分配策略。作者在训练的时候同事监督训练两个策略,在推理的时候用one-to-one,实现nms-free。 同时使用一些列的策略

来实现训练的时候one-to-one & one-to-many 的分配和计算,使one-to-one获得one-to-many最佳的效果。

一些列高效的模型

包括:轻量化分类头、空间通道解耦的下采样、层级模块设计、采用大卷积核、部分的自注意力机制 等。使模型更鲁棒;

experiments:

实验显示模型又快又好!值得推荐。

相关推荐
智驱力人工智能8 分钟前
仓库园区无人机烟雾识别:构建立体化、智能化的早期火灾预警体系 无人机烟雾检测 无人机动态烟雾分析AI系统 无人机辅助火灾救援系统
人工智能·opencv·算法·目标检测·架构·无人机·边缘计算
思通数据1 小时前
市政道路无人机巡检:AI视觉技术的应用与挑战
人工智能·深度学习·安全·目标检测·机器学习·无人机·语音识别
智驱力人工智能1 小时前
森林防火无人机火焰监测系统 构建“天空地”一体化智能防火体系 无人机火焰检测,支持红色火焰检测 城市高层建筑无人机火焰识别
人工智能·深度学习·opencv·算法·目标检测·无人机·边缘计算
Coovally AI模型快速验证1 小时前
无人机低空视觉数据集全景解读:从单机感知到具身智能的跨
人工智能·深度学习·目标检测·机器学习·自动驾驶·无人机
dlhto2 小时前
YOLOv8 模型权重格式详解
yolo·deep learning
Dev7z2 小时前
基于YOLOv11的独居老人摔倒识别设计与实现(数据集+UI界面+训练代码+数据分析)
yolo
智驱力人工智能3 小时前
无人机河道漂浮物检测 从项目构建到价值闭环的系统工程 无人机河道垃圾识别 农村河道漂浮物智能清理方案 无人机辅助河道清洁预警
opencv·算法·安全·yolo·目标检测·无人机·边缘计算
m0_650108243 小时前
MindDrive:融合世界模型与视觉语言模型的端到端自动驾驶框架
论文阅读·自动驾驶·轨迹生成与规划·世界动作模型·e2e-ad·vlm导向评估器·minddrive
CoookeCola3 小时前
无需抠图!Qwen-Image-Layered 一键分解图像图层,支持图层级精准编辑
论文阅读·深度学习·计算机视觉·ai作画·开源·视觉检测·aigc
Norach3 小时前
Ubuntu升级opencv版本至4.9.0
linux·经验分享·opencv·yolo·ubuntu·dnn