CVPR论文《DETRs Beat YOLOs on Real-time Object Detection》读后思维导图

下面欣赏一下论文中的图和表:

1、与YOLOs的性能对比图

2、不同置信度阈值下的框数

3、IoU阈值和置信度阈值对准确性和NMS执行时间的影响

4、混合编码器不同变体

5、模型概述。将骨干网后三个阶段的特征输入到编码器中。高效混合编码器通过基于注意力的尺度内特征交互(AIFI)和基于cnn的跨尺度特征融合(CCFF)将多尺度特征转化为图像特征序列。然后,最小不确定性查询选择选择固定数量的编码器特征作为解码器的初始对象查询。

最后,具有辅助预测头的解码器迭代优化对象查询以生成类别和框

6、CCFF中的融合Fusion模块结构图

7、最小不确定性查询和普通查询对比。所选编码器特征的分类和IoU分数。紫色点和绿色点分别表示用最小不确定性查询选择和普通查询选择训练的模型中选择的特征。

8、与SOTA的比较

9、不同变体(A、B、C、D、E)的性能对比,即混合编码器的消融实验

10、查询选择的消融实验

11、解码器层数的消融实验

以上图和表若有疑问欢迎评论留言,竭力解答~~~

(不过这次读得好慢好慢啊啊啊啊啊!!有啥快速读论文的好方法吗???求助呜呜呜~)

相关推荐
c#上位机11 小时前
halcon求区域交集——intersection
图像处理·人工智能·计算机视觉·c#·halcon
中冕—霍格沃兹软件开发测试11 小时前
探索性测试:思维驱动下的高效缺陷狩猎
人工智能·科技·开源·appium·bug
cnfalcon11 小时前
ESP-IDF AI硬件开发技术问题记录
人工智能·esp-idf
陈佬昔没带相机11 小时前
从罗永浩 x MiniMax 闫俊杰对谈中,一窥 AI 时代软件公司岗位变化
人工智能·程序员·敏捷开发
老马啸西风11 小时前
成熟企业级技术平台-09-加密机 / 密钥管理服务 KMSS(Key Management & Security Service)
人工智能·深度学习·算法·职场和发展
2301_8018217111 小时前
前期工作总结
人工智能
weixin_4620223511 小时前
RAW-Adapter: Adapting Pre-trained Visual Model to Camera RAW Images
python·计算机视觉
Ulana12 小时前
计算机基础10大高频考题解析
java·人工智能·算法
windfantasy199012 小时前
NCT与GESP哪个更好?线上监考与线下考点的便利性对比
人工智能
执笔论英雄12 小时前
【LORA】
人工智能