在目标检测上使用扩散模型
前向过程:真实框-->随机框
后向过程:随机框-->真实框
前向过程:
一般一张图片真实框的数目不同,填补到同一的N个框,填补方法可以是重复真实框,填补和图片大小一样的框,或者随机框,填补随机框效果最好。然后,给每个框逐步添加高斯噪声,生成随机框。
特征提取和检测decoder解耦。
decoder用的Sparse R-CNN
sample的时候和PPDM不同,多增加一步DDIM处理过程。
在8 GPUs训练的,450K iterations。
在目标检测上使用扩散模型
前向过程:真实框-->随机框
后向过程:随机框-->真实框
前向过程:
一般一张图片真实框的数目不同,填补到同一的N个框,填补方法可以是重复真实框,填补和图片大小一样的框,或者随机框,填补随机框效果最好。然后,给每个框逐步添加高斯噪声,生成随机框。
特征提取和检测decoder解耦。
decoder用的Sparse R-CNN
sample的时候和PPDM不同,多增加一步DDIM处理过程。
在8 GPUs训练的,450K iterations。