CVPR论文《DETRs Beat YOLOs on Real-time Object Detection》读后思维导图

下面欣赏一下论文中的图和表:

1、与YOLOs的性能对比图

2、不同置信度阈值下的框数

3、IoU阈值和置信度阈值对准确性和NMS执行时间的影响

4、混合编码器不同变体

5、模型概述。将骨干网后三个阶段的特征输入到编码器中。高效混合编码器通过基于注意力的尺度内特征交互(AIFI)和基于cnn的跨尺度特征融合(CCFF)将多尺度特征转化为图像特征序列。然后,最小不确定性查询选择选择固定数量的编码器特征作为解码器的初始对象查询。

最后,具有辅助预测头的解码器迭代优化对象查询以生成类别和框

6、CCFF中的融合Fusion模块结构图

7、最小不确定性查询和普通查询对比。所选编码器特征的分类和IoU分数。紫色点和绿色点分别表示用最小不确定性查询选择和普通查询选择训练的模型中选择的特征。

8、与SOTA的比较

9、不同变体(A、B、C、D、E)的性能对比,即混合编码器的消融实验

10、查询选择的消融实验

11、解码器层数的消融实验

以上图和表若有疑问欢迎评论留言,竭力解答~~~

(不过这次读得好慢好慢啊啊啊啊啊!!有啥快速读论文的好方法吗???求助呜呜呜~)

相关推荐
朝朝暮暮Quake7 分钟前
情感计算多模态融合方法
人工智能
MoRanzhi120325 分钟前
2. Pandas 核心数据结构:Series 与 DataFrame
大数据·数据结构·人工智能·python·数据挖掘·数据分析·pandas
赋创小助手27 分钟前
Supermicro NVIDIA Grace Superchip存储服务器超微ARS-121L-NE316R开箱评测
运维·服务器·人工智能·深度学习·机器学习·自然语言处理
rongqing201937 分钟前
论文笔记:On the Biology of a Large Language Model
人工智能
千宇宙航39 分钟前
闲庭信步使用图像验证平台加速FPGA的开发:第三十课——车牌识别的FPGA实现(2)实现车牌定位
图像处理·计算机视觉·fpga开发·车牌识别
AndrewHZ1 小时前
【3D图像技术讨论】3A游戏场景重建实战指南:从数据采集到实时渲染的开源方案
人工智能·算法·游戏·3d·开源·llm·colmap
syounger1 小时前
SAP与阿里巴巴战略合作升级:四大核心云解决方案落地阿里云
大数据·人工智能·阿里云
wyiyiyi2 小时前
【数据结构+算法】迭代深度搜索(IDS)及其时间复杂度和空间复杂度
数据结构·人工智能·笔记·算法·深度优先·迭代加深
三年呀2 小时前
量子机器学习深度探索:从原理到实践的全面指南
人工智能·深度学习·机器学习·量子计算