CVPR论文《DETRs Beat YOLOs on Real-time Object Detection》读后思维导图

下面欣赏一下论文中的图和表:

1、与YOLOs的性能对比图

2、不同置信度阈值下的框数

3、IoU阈值和置信度阈值对准确性和NMS执行时间的影响

4、混合编码器不同变体

5、模型概述。将骨干网后三个阶段的特征输入到编码器中。高效混合编码器通过基于注意力的尺度内特征交互(AIFI)和基于cnn的跨尺度特征融合(CCFF)将多尺度特征转化为图像特征序列。然后,最小不确定性查询选择选择固定数量的编码器特征作为解码器的初始对象查询。

最后,具有辅助预测头的解码器迭代优化对象查询以生成类别和框

6、CCFF中的融合Fusion模块结构图

7、最小不确定性查询和普通查询对比。所选编码器特征的分类和IoU分数。紫色点和绿色点分别表示用最小不确定性查询选择和普通查询选择训练的模型中选择的特征。

8、与SOTA的比较

9、不同变体(A、B、C、D、E)的性能对比,即混合编码器的消融实验

10、查询选择的消融实验

11、解码器层数的消融实验

以上图和表若有疑问欢迎评论留言,竭力解答~~~

(不过这次读得好慢好慢啊啊啊啊啊!!有啥快速读论文的好方法吗???求助呜呜呜~)

相关推荐
Blossom.1181 小时前
使用Python和Scikit-Learn实现机器学习模型调优
开发语言·人工智能·python·深度学习·目标检测·机器学习·scikit-learn
scdifsn2 小时前
动手学深度学习12.7. 参数服务器-笔记&练习(PyTorch)
pytorch·笔记·深度学习·分布式计算·数据并行·参数服务器
DFminer2 小时前
【LLM】fast-api 流式生成测试
人工智能·机器人
郄堃Deep Traffic2 小时前
机器学习+城市规划第十四期:利用半参数地理加权回归来实现区域带宽不同的规划任务
人工智能·机器学习·回归·城市规划
海盗儿3 小时前
Attention Is All You Need (Transformer) 以及Transformer pytorch实现
pytorch·深度学习·transformer
GIS小天3 小时前
AI+预测3D新模型百十个定位预测+胆码预测+去和尾2025年6月7日第101弹
人工智能·算法·机器学习·彩票
阿部多瑞 ABU3 小时前
主流大语言模型安全性测试(三):阿拉伯语越狱提示词下的表现与分析
人工智能·安全·ai·语言模型·安全性测试
cnbestec3 小时前
Xela矩阵三轴触觉传感器的工作原理解析与应用场景
人工智能·线性代数·触觉传感器
不爱写代码的玉子3 小时前
HALCON透视矩阵
人工智能·深度学习·线性代数·算法·计算机视觉·矩阵·c#
sbc-study4 小时前
PCDF (Progressive Continuous Discrimination Filter)模块构建
人工智能·深度学习·计算机视觉