扩散模型

摇落露为霜4 天前
人工智能·深度学习·transformer·扩散模型·dit
论文笔记DiT:Scalable Diffusion Models with Transformers(含transformer的可扩展扩散模型 )Abstract:论文的核心思想非常直接:用一个标准的 Transformer 架构替换掉扩散模型中常用的 U-Net 主干网络,并证明这种新架构(称为 DiT, Diffusion Transformer)具有出色的可扩展性(Scalability)。
夏莉莉iy11 天前
人工智能·深度学习·transformer·图像·扩散模型·视觉·dit
[ICCV 2023]Scalable Diffusion Models with Transformers论文网址:Scalable Diffusion Models with Transformers项目网址:Scalable Diffusion Models with Transformers
-cywen-18 天前
扩散模型
ELBO和VLBELBO(Evidence Lower BOund)和 VLB(Variational Lower Bound)是同一个概念的两种叫法
风巽·剑染春水21 天前
人工智能·生成式ai·扩散模型·综述·智能体·世界模型
【World Models综述】理解世界还是预测未来?(ACM CS-2025)探索世界模型从阅读一篇综述开始!论文:Understanding World or Predicting Future? A Comprehensive Survey of World Models 论文与代码汇总:https://github.com/tsinghua-fib-lab/World-Model
杀生丸学AI22 天前
数码相机·aigc·扩散模型·图像编辑·视觉大模型·点云分割
【动态重建】SparseCam4D:基于稀疏相机实现时空一致的4D重建技术SparseCam4D: Spatio-Temporally Consistent 4D Reconstruction from Sparse Cameras 项目主页: 浙大CAD;InSpatio Research
杀生丸学AI22 天前
3d·aigc·扩散模型·视觉大模型·点云分割·高斯泼溅·空间智能
【三维重建】Neural Gabor Splatting:基于神经Gabor的增强型3DGS(高频表面重建)Neural Gabor Splatting: Enhanced Gaussian Splatting with Neural Gabor for High-frequency Surface Reconstruction 来源: 东京大学
scott1985121 个月前
人工智能·扩散模型·生成式
VAE与扩散模型的reconstruction–generation dilemma论文: https://arxiv.org/abs/2603.05630代码: https://github.com/tongdaxu/Making-rFID-Predictive-of-Diffusion-gFID.git
阿钱真强道1 个月前
生成对抗网络·aigc·gan·vae·生成模型·stablediffusion·扩散模型
07 ComfyUI + SVD 系列(五)GAN、VAE、扩散模型到底有什么区别?一篇文章讲清楚 AI 绘图模型的前世今生这两年,AI 绘图已经强到什么程度了?你输入一句话:几秒钟之后,一张像模像样、甚至细节惊人的图片就出来了。
阿钱真强道1 个月前
aigc·sdxl·stablediffusion·扩散模型·视频生成·sdv·图片生成
08 ComfyUI + SVD 系列(六)从 SDXL 到 SDV:为什么说视频生成本质上是“带时间维度的图片生成”?如果你已经用过 SDXL 生成图片,又开始接触 SDV 这类视频模型,那么你大概率会冒出这样一个想法:
这张生成的图像能检测吗1 个月前
人工智能·计算机视觉·controlnet·扩散模型·条件控制扩散模型
(论文速读)ControlNet-XS: 从反馈控制系统视角重新思考图像生成的控制机制论文题目:ControlNet-XS: Rethinking the Control of Text-to-Image Diffusion Models as Feedback-Control Systems(重新思考文本到图像扩散模型作为反馈控制系统的控制)
这张生成的图像能检测吗1 个月前
人工智能·计算机视觉·扩散模型·工业物联网·寿命预测
(论文速读)RUL- diff:基于生成扩散模型的剩余使用寿命预测深度学习框架论文题目:Generative-Diffusion-Model-Based Deep-Learning Framework for Remaining Useful Life Prediction(基于生成扩散模型的剩余使用寿命预测深度学习框架)
风巽·剑染春水2 个月前
人工智能·深度学习·生成模型·diffusion·扩散模型
【扩散模型原理】(三)Score-Based Perspective: From EBMs to NCSN《扩散模型原理:从起源到发展》:第三章 基于分数的视角:从 EBMs 到 NCSN专著:The Principles of Diffusion Models
机器学习之心2 个月前
神经网络·matlab·回归·扩散模型·bp神经网络回归预测
扩散模型(Diffusion Model)数据生成+BP神经网络回归预测,Matlab完整代码该代码实现了一个基于扩散模型进行数据增强,并结合BP神经网络进行回归预测的完整流程。在回归预测任务中,若原始训练样本量较少,模型容易出现过拟合、泛化能力差的问题。扩散模型作为近年来的生成模型,可通过学习数据分布生成高质量新样本,从而扩充训练集,提升下游回归模型的稳定性与预测精度。
scott1985122 个月前
深度学习·stable diffusion·扩散模型·生成式
扩散模型之(二十)Stable Diffusion的运作原理Stable Diffusion作为 Latent Diffusion的继承与发展,它的发布是这一发展历程中的一个重要里程碑,因为它将高性能模型带给了大众(性能体现在图像质量、速度以及相对较低的资源/内存需求等方面)。本文对Stable Diffusion的工作原理与发展过程技术演进进行对比。
杀生丸学AI2 个月前
人工智能·三维重建·扩散模型·具身智能·视频生成·世界模型·空间智能
【世界模型】video2world:从不一致视角重建世界标题:World Reconstruction From Inconsistent Views 来源:德国慕尼黑工业大学 链接:https://lukashoel.github.io/video_to_world
这张生成的图像能检测吗2 个月前
扩散模型·视频生成·可控交互动力学
(论文速读)InterDyn: 视频扩散模型的可控交互动力学论文题目:InterDyn: Controllable Interactive Dynamics with Video Diffusion Models(视频扩散模型的可控交互动力学)
Michaelliu_dev2 个月前
sd·stablediffusion·扩散模型·inpainting·powerpaint·objectremoval·物体消除
《PowerPaint》论文详解原文地址:https://arxiv.org/pdf/2312.03594代码地址:https://github.com/open-mmlab/PowerPaint
简单光学2 个月前
深度学习·扩散模型·散射成像·分数匹配·随机微分方程
ISDM: 基于生成扩散模型的散射介质成像重建技术报告散射介质成像是一项具有重大科学意义和广泛应用前景的技术挑战。当光波通过散射介质(如雾、生物组织、磨砂玻璃等)时,会发生多重散射现象,导致原始图像信息被严重破坏,形成随机散斑图样。本研究探讨了一种基于生成扩散模型的散射介质成像重建方法(ISDM),通过训练深度神经网络学习图像的分数函数,利用反向扩散采样过程从散斑图像中恢复原始目标图像。该方法采用方差爆炸随机微分方程(VESDE)建模前向扩散过程,使用NCSN++网络架构估计分数函数,结合预测-校正采样策略和数据一致性约束实现高质量图像重建。实验结果表明,与
Echo_NGC22372 个月前
人工智能·贝叶斯·概率论·扩散模型
【贝叶斯公式】从先验到后验的概率推演📚 专为机器学习与统计学学习者打造的专业教程🎯 目标:严谨、透彻地解析贝叶斯定理的核心原理、数学推导与现实应用
强化学习与机器人控制仿真2 个月前
人工智能·神经网络·机器人·强化学习·扩散模型·英伟达·人形机器人
Kimodo 入门教程(一)英伟达开源人形机器人动捕数据集训练运动学动作扩散模型目录系列文章目录前言亮点一、安装1.1 配置 Hugging Face 令牌1.2 Kimodo 安装选项 1:包安装