论文阅读——DiffusionDet

在目标检测上使用扩散模型

前向过程:真实框-->随机框

后向过程:随机框-->真实框

前向过程:

一般一张图片真实框的数目不同,填补到同一的N个框,填补方法可以是重复真实框,填补和图片大小一样的框,或者随机框,填补随机框效果最好。然后,给每个框逐步添加高斯噪声,生成随机框。

特征提取和检测decoder解耦。

decoder用的Sparse R-CNN

sample的时候和PPDM不同,多增加一步DDIM处理过程。

在8 GPUs训练的,450K iterations。

相关推荐
火山引擎开发者社区3 小时前
Agent Plan、Coding Plan限时优惠:2.5折畅享多模型!
人工智能
冬奇Lab3 小时前
AI Workflow 定义的四次演进:从 Markdown 到 JS 脚本,再到分布式多 Agent
javascript·人工智能·agent
冬奇Lab3 小时前
每日一个开源项目(第136篇):OpenMemory - 给 AI Agent 真正的认知记忆引擎
人工智能
黄啊码4 小时前
【黄啊码】微信 AI 把聊天功能和 Vibe Coding打通了,创业者:我又白干了
人工智能
IT_陈寒5 小时前
React的useState居然还有这种坑?我差点删库跑路
前端·人工智能·后端
用户413062258296 小时前
给AI回答加引用角标citation:RAG前端实现
人工智能
米小虾6 小时前
WAIC 2026 倒计时30天:300+ AI 产品全球首发,今年看点全解析
人工智能
码上天下6 小时前
多模态Agent上传图片:前端压缩格式与预览实战
人工智能