论文阅读——DiffusionDet

在目标检测上使用扩散模型

前向过程:真实框-->随机框

后向过程:随机框-->真实框

前向过程:

一般一张图片真实框的数目不同,填补到同一的N个框,填补方法可以是重复真实框,填补和图片大小一样的框,或者随机框,填补随机框效果最好。然后,给每个框逐步添加高斯噪声,生成随机框。

特征提取和检测decoder解耦。

decoder用的Sparse R-CNN

sample的时候和PPDM不同,多增加一步DDIM处理过程。

在8 GPUs训练的,450K iterations。

相关推荐
xier_ran2 分钟前
【BUG问题】5060Ti显卡Windows配置Anaconda中的CUDA及Pytorch,sm_120问题
人工智能·pytorch·windows
nix.gnehc2 分钟前
AI Coding 演进史:从代码补全到智能体军团的四次范式革命
人工智能
前端之虎陈随易5 分钟前
为什么今天还会有新语言?MoonBit 想解决什么问题?
大数据·linux·javascript·人工智能·算法·microsoft·typescript
python零基础入门小白5 分钟前
Transformer、Token、RAG全解析,一篇读懂大模型核心机制!
人工智能·深度学习·学习·语言模型·大模型·transformer·产品经理
庞轩px9 分钟前
AI辅助编程的边界——Cursor实战与工程判断力
人工智能·ai·大模型·prompt·code review·aicoding
Baihai IDP11 分钟前
为什么 AI Agent 重新爱上了文件系统(Filesystems)
人工智能·ai·llm·agi
70asunflower15 分钟前
从需求洞察到生态博弈
人工智能·芯片
~kiss~22 分钟前
How OpenAI delivers low-latency voice AI at scale - OpenAI 如何规模化实现低延迟语音 AI
人工智能
后端小肥肠22 分钟前
白嫖小云雀 API 200 秒免费额度,封装 Skill,玩转 Seedance2.0 视频
人工智能·agent
河西石头23 分钟前
听AI的血的教训!PPOCRLabel部署与PyQt5的安装避坑-百分百成功!
开发语言·人工智能·python·pyqt5安装·ppocrlabel的部署