论文阅读【检测】:Facebook ECCV2020 | DETR

文章目录

论文地址

DETR

Abstract

提出了一种将目标检测视为直接集预测问题 的新方法。简化了检测pipeline,有效地消除了许多手工设计的组件的需求,例如非最大抑制过程或锚生成,这些组件明确地编码了任务的先验知识。新框架的主要成分,是基于集合的全局损失,它通过二部匹配强制唯一的预测,以及变transformer encoder-decoder架构。给定一组固定的学习对象查询,DETR 推理对象和全局图像上下文的关系,以并行直接输出最终的预测集。DETR在具有挑战性的COCO对象检测数据集上展示了与成熟和高度优化的Faster RCNN基线相当的准确性和运行时性能。

Motivation

通常检测器通过在proposal、anchor 或center point 上定义代理回归和分类问题,以间接方式解决该集合预测任务。它们的性能受到后处理步骤、锚集的设计以及将目标框分配给锚的启发式方法显着影响。为了简化这些pipeline,所以提出了一种直接集预测方法来绕过代理任务。

模型框架

从论文图中可以看出,整个pipeline确实很简单。


详细结构

图像先经过下采样,用小的feature map输入transformer结构中,必然导致了对小目标检测效果较差。论文中也明确说了这个问题。 初始化的queries为0, 同时position embedding 每个模块都要加一次

Encoder

Decoder

小结

确实简化都不少手工设计的组建,但是在小目标的表现上较差。NMS感觉还是需要的,不可能刚刚好一个目标对应预测一个框。

相关推荐
落痕的寒假11 小时前
[论文总结] 深度学习在农业领域应用论文笔记14
论文阅读·人工智能·深度学习
梦云澜15 小时前
论文阅读(十):用可分解图模型模拟连锁不平衡
论文阅读·人工智能·深度学习
AIGC大时代1 天前
对比DeepSeek、ChatGPT和Kimi的学术写作撰写引言能力
数据库·论文阅读·人工智能·chatgpt·数据分析·prompt
梦云澜1 天前
论文阅读(十二):全基因组关联研究中生物通路的图形建模
论文阅读·人工智能·深度学习
摸鱼仙人~2 天前
Attention Free Transformer (AFT)-2020论文笔记
论文阅读·深度学习·transformer
AIGC大时代2 天前
对比DeepSeek、ChatGPT和Kimi的学术写作关键词提取能力
论文阅读·人工智能·chatgpt·数据分析·prompt
梦云澜2 天前
论文阅读(九):通过概率图模型建立连锁不平衡模型和进行关联研究:最新进展访问之旅
论文阅读·人工智能·深度学习
AIGC大时代3 天前
学术方向选则与规划DeepSeek、ChatGPT和Kimi对比
论文阅读·人工智能·chatgpt·数据分析·prompt
程序喵;3 天前
Retrieval-Augmented Generation for Large Language Models: A Survey——(1)Overview
论文阅读·人工智能·语言模型·自然语言处理·rag