Deformable DETR中的look forword once

在DINO中正对Deformable DETR中的look forward once做了改进

左图是Deformable DETR,右图是DINO

Look Forward Once对应的代码部分:

怎么理解iterative box refinement 可以阻止梯度反向传播来稳定训练?

python 复制代码
reference_points = new_reference_points.detach()
  • 什么是梯度切断? 切断梯度表示阻止反向传播的梯度从当前层的 reference_points 传播到上一层。也就是说,后续层的梯度不会影响前一层生成的边界框参考点。

  • 实现效果: 每一层的 reference_points 是通过当前层的预测生成的,但它不会受到后续层优化路径的影响,从而确保预测的独立性。

代码解析

1. DeformableTransformerDecoder中的self.box_embed不是赋值为None吗?在哪儿改变的值?

解答:

  • self.bbox_embed 被克隆为多个独立的实例,每个解码器层对应一个独立的 bbox_embed 模块。
  • 然后,self.bbox_embed 被赋值到 self.transformer.decoder.bbox_embed
  • 这一赋值操作是外部对 DeformableTransformerDecoder.bbox_embed 的修改。
相关推荐
Blossom.1185 小时前
量子计算:未来计算技术的革命性突破
人工智能·科技·深度学习·神经网络·机器学习·计算机视觉·量子计算
Wnq100725 小时前
DEEPSEEK创业项目推荐:
运维·计算机视觉·智能硬件·ai创业·deepseek
程序员JerrySUN9 小时前
走进 detect.tflite:树莓派目标检测背后的核心模型详解
人工智能·目标检测·计算机视觉
xc101111 小时前
树莓派5从零开发至脱机脚本运行教程——6.实战篇
人工智能·opencv·计算机视觉
www_pp_12 小时前
# 基于 OpenCV 的选择题自动批改系统实现
人工智能·opencv·计算机视觉
梦姐的编程日志12 小时前
从研究动机视角对无监督图像去雾论文的分类
图像处理·人工智能·深度学习·算法·计算机视觉
不吃香菜?13 小时前
opencv图像处理之指纹验证
人工智能·opencv·计算机视觉
郝YH是人间理想14 小时前
OpenCV基础——轮廓检测、模板匹配、图像均衡化
开发语言·图像处理·人工智能·python·opencv·计算机视觉
云梦之上14 小时前
视觉风格提示词:Visual Style Prompting with Swapping Self-Attention(风格迁移)
pytorch·python·计算机视觉·ai作画·prompt
s1ckrain14 小时前
【论文阅读】LongDiff:Training-Free Long Video Generation in One Go
论文阅读·人工智能·计算机视觉