论文阅读——DiffusionDet

在目标检测上使用扩散模型

前向过程:真实框-->随机框

后向过程:随机框-->真实框

前向过程:

一般一张图片真实框的数目不同,填补到同一的N个框,填补方法可以是重复真实框,填补和图片大小一样的框,或者随机框,填补随机框效果最好。然后,给每个框逐步添加高斯噪声,生成随机框。

特征提取和检测decoder解耦。

decoder用的Sparse R-CNN

sample的时候和PPDM不同,多增加一步DDIM处理过程。

在8 GPUs训练的,450K iterations。

相关推荐
羊小猪~~35 分钟前
数据库学习笔记(十五)--变量与定义条件与处理程序
数据库·人工智能·笔记·后端·sql·学习·mysql
ahhhhaaaa-41 分钟前
【AI图像生成网站&Golang】部署图像生成服务(阿里云ACK+GPU实例)
开发语言·数据仓库·人工智能·后端·阿里云·golang
摘取一颗天上星️1 小时前
NLP进化史:从规则模板到思维链推理,七次范式革命全解析
人工智能·自然语言处理
知舟不叙1 小时前
深度学习——基于PyTorch的MNIST手写数字识别详解
人工智能·pytorch·深度学习·手写数字识别
Jamence2 小时前
多模态大语言模型arxiv论文略读(118)
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
愚农搬码2 小时前
LangChain 调用不同类型的多MCP服务
人工智能·后端
AI速译官2 小时前
字节跳动推出视频生成新模型Seedance
人工智能
chenquan3 小时前
ArkFlow 流处理引擎 0.4.0-rc1 发布
人工智能·后端·github
Se7en2583 小时前
使用 Higress AI 网关代理 vLLM 推理服务
人工智能
AI大模型技术社3 小时前
PyTorch手撕CNN:可视化卷积过程+ResNet18训练代码详解
人工智能·神经网络