论文阅读——DiffusionDet

在目标检测上使用扩散模型

前向过程:真实框-->随机框

后向过程:随机框-->真实框

前向过程:

一般一张图片真实框的数目不同,填补到同一的N个框,填补方法可以是重复真实框,填补和图片大小一样的框,或者随机框,填补随机框效果最好。然后,给每个框逐步添加高斯噪声,生成随机框。

特征提取和检测decoder解耦。

decoder用的Sparse R-CNN

sample的时候和PPDM不同,多增加一步DDIM处理过程。

在8 GPUs训练的,450K iterations。

相关推荐
飞哥数智坊1 小时前
openclaw 不是全站第一!但它的爆发,足以引人深思
人工智能
zone77392 小时前
001:LangChain的LCEL语法学习
人工智能·后端·面试
程序员鱼皮3 小时前
微软竟然出了免费的 AI 应用开发课?!我已经学上了
人工智能·程序员·ai编程
DevnullCoffe3 小时前
基于 OpenClaw + Pangolinfo API 的 Amazon 价格监控系统:架构设计与最佳实践
人工智能·架构
Baihai_IDP3 小时前
回头看 RLHF、PPO、DPO、GRPO 与 RLVR 的发展路径
人工智能·llm·强化学习
aristotle3 小时前
Openclow安装保姆级教程
人工智能·程序员
明明如月学长3 小时前
从 Subagent 到 Team:Claude Code 把 AI 协同玩明白了
人工智能
叶落阁主3 小时前
揭秘 Happy:如何实现 AI 编程助手输出的实时同步
人工智能·claude·vibecoding
王鑫星3 小时前
Anthropic 把自己发明的协议捐了:MCP 入驻 Linux 基金会,OpenAI 竟然也签了名
人工智能
陈少波AI应用笔记3 小时前
OpenClaw安全实测:4种攻击方式与防护指南
人工智能