扩散模型

这张生成的图像能检测吗4 天前
人工智能·计算机视觉·扩散模型·工业物联网·寿命预测
(论文速读)RUL- diff:基于生成扩散模型的剩余使用寿命预测深度学习框架论文题目:Generative-Diffusion-Model-Based Deep-Learning Framework for Remaining Useful Life Prediction(基于生成扩散模型的剩余使用寿命预测深度学习框架)
风巽·剑染春水7 天前
人工智能·深度学习·生成模型·diffusion·扩散模型
【扩散模型原理】(三)Score-Based Perspective: From EBMs to NCSN《扩散模型原理:从起源到发展》:第三章 基于分数的视角:从 EBMs 到 NCSN专著:The Principles of Diffusion Models
机器学习之心7 天前
神经网络·matlab·回归·扩散模型·bp神经网络回归预测
扩散模型(Diffusion Model)数据生成+BP神经网络回归预测,Matlab完整代码该代码实现了一个基于扩散模型进行数据增强,并结合BP神经网络进行回归预测的完整流程。在回归预测任务中,若原始训练样本量较少,模型容易出现过拟合、泛化能力差的问题。扩散模型作为近年来的生成模型,可通过学习数据分布生成高质量新样本,从而扩充训练集,提升下游回归模型的稳定性与预测精度。
scott1985128 天前
深度学习·stable diffusion·扩散模型·生成式
扩散模型之(二十)Stable Diffusion的运作原理Stable Diffusion作为 Latent Diffusion的继承与发展,它的发布是这一发展历程中的一个重要里程碑,因为它将高性能模型带给了大众(性能体现在图像质量、速度以及相对较低的资源/内存需求等方面)。本文对Stable Diffusion的工作原理与发展过程技术演进进行对比。
杀生丸学AI13 天前
人工智能·三维重建·扩散模型·具身智能·视频生成·世界模型·空间智能
【世界模型】video2world:从不一致视角重建世界标题:World Reconstruction From Inconsistent Views 来源:德国慕尼黑工业大学 链接:https://lukashoel.github.io/video_to_world
这张生成的图像能检测吗15 天前
扩散模型·视频生成·可控交互动力学
(论文速读)InterDyn: 视频扩散模型的可控交互动力学论文题目:InterDyn: Controllable Interactive Dynamics with Video Diffusion Models(视频扩散模型的可控交互动力学)
Michaelliu_dev17 天前
sd·stablediffusion·扩散模型·inpainting·powerpaint·objectremoval·物体消除
《PowerPaint》论文详解原文地址:https://arxiv.org/pdf/2312.03594代码地址:https://github.com/open-mmlab/PowerPaint
简单光学19 天前
深度学习·扩散模型·散射成像·分数匹配·随机微分方程
ISDM: 基于生成扩散模型的散射介质成像重建技术报告散射介质成像是一项具有重大科学意义和广泛应用前景的技术挑战。当光波通过散射介质(如雾、生物组织、磨砂玻璃等)时,会发生多重散射现象,导致原始图像信息被严重破坏,形成随机散斑图样。本研究探讨了一种基于生成扩散模型的散射介质成像重建方法(ISDM),通过训练深度神经网络学习图像的分数函数,利用反向扩散采样过程从散斑图像中恢复原始目标图像。该方法采用方差爆炸随机微分方程(VESDE)建模前向扩散过程,使用NCSN++网络架构估计分数函数,结合预测-校正采样策略和数据一致性约束实现高质量图像重建。实验结果表明,与
Echo_NGC223720 天前
人工智能·贝叶斯·概率论·扩散模型
【贝叶斯公式】从先验到后验的概率推演📚 专为机器学习与统计学学习者打造的专业教程🎯 目标:严谨、透彻地解析贝叶斯定理的核心原理、数学推导与现实应用
强化学习与机器人控制仿真22 天前
人工智能·神经网络·机器人·强化学习·扩散模型·英伟达·人形机器人
Kimodo 入门教程(一)英伟达开源人形机器人动捕数据集训练运动学动作扩散模型目录系列文章目录前言亮点一、安装1.1 配置 Hugging Face 令牌1.2 Kimodo 安装选项 1:包安装
杀生丸学AI1 个月前
3d·aigc·扩散模型·视觉大模型·世界模型·点云分割·高斯泼溅
【世界模型】WorldWarp:异步视频扩散的3D重建标题:《WorldWarp: Propagating 3D Geometry with Asynchronous Video Diffusion》 项目:https://hyokong.github.io/worldwarp-page/ 来源:新加坡国立大学 ;香港理工大学
杀生丸学AI2 个月前
aigc·扩散模型·视觉大模型·点云分割·lora微调·空间智能
【点云分割】SNAP:面向任意点云的任意分割标题:《SNAP: Towards Segmenting Anything in Any Point Cloud》 项目:https://neu-vi.github.io/SNAP/ 来源:东北大学;The Mathworks
杀生丸学AI2 个月前
人工智能·扩散模型·具身智能·视频生成·世界模型·自回归·空间智能
【世界模型】AI世界模型的两次物理大考(测评)如果你让当今最先进的AI视频模型生成一段“冰块落入温水”的视频,你很可能会得到一个画质惊艳、光线完美、动态流畅的短片。它几乎能以假乱真。
杀生丸学AI2 个月前
aigc·三维重建·扩散模型·图像生成·视觉大模型·lora微调·空间智能
【三维生成】ShapeR:单目视频的条件三维形状生成标题:《ShapeR: Robust Conditional 3D Shape Generation from Casual Captures》 项目:facebookresearch.github.io/ShapeR 来源:Meta Reality Labs Research;Simon Fraser University
dxz_tust2 个月前
开发语言·python·深度学习·扩散模型·流匹配·flow match
flow match简单直观理解最后结果图:其他结果图(从高斯建立多个高斯):
AMiner:AI科研助手3 个月前
扩散模型·多模态大模型·浙江大学·港中文·音频视频生成模型
NeurIPS 2025 Spotlight |新国立联合港中文发布JavisGPT:终结默片时代!在通往通用人工智能(AGI)的征途中, 如何让机器像人类一样同时看懂画面、听懂声音,并进行连贯的视听创作,始终是多模态领域面临的巨大挑战。
m0_650108243 个月前
论文阅读·自动驾驶·扩散模型·联合预测与规划建模·分类器引导机制
Diffusion-Planner:基于扩散模型的自动驾驶灵活引导闭环规划在复杂开放环境中实现类人驾驶行为是自动驾驶领域的核心挑战。现有基于学习的规划方法(如模仿学习)在平衡多目标、保证安全性方面存在不足,且过度依赖规则化后处理。本文提出一种基于 Transformer 的 Diffusion Planner,首次将扩散模型的强大能力应用于自动驾驶闭环规划。该模型通过联合建模预测与规划任务,利用轨迹得分函数梯度学习和灵活的分类器引导机制,在无需规则化优化的前提下,有效捕捉多模态驾驶行为,同时保证轨迹安全性与适应性。在大规模真实世界数据集 nuPlan 和新增的 200 小时配送
李加号pluuuus3 个月前
扩散模型
【论文阅读】Image Referenced Sketch Colorization Based on Animation Creation Workflow动机:解决空间纠缠的问题。参考图上色通常是:输入线稿/草图(sketch)+ 一张参考彩色图(reference),希望输出的颜色/材质“像参考图”,但结构/布局“像线稿”。困难在于:reference 的图像特征(尤其是 ViT/CLIP 的 token)天然带有布局、大小、对象共现等语义,当 reference 是“只有角色的立绘/大头照”时,这些语义很容易“越权”,导致模型在背景里也“长出角色碎片/衣服/头发纹理”,或者把角色配色污染到背景——这就是空间纠缠。
李加号pluuuus3 个月前
扩散模型
MangaNinja: Line Art Colorization with Precise Reference Following目标:输入目标线稿、参考彩色图(同一角色、但姿态/尺度/视角可能差很多)、(可选)用户给的匹配点,输出:彩色结果,要求颜色与身份细节跟参考图一致,并且结构跟线稿一致。
R.X. NLOS3 个月前
大模型·大厂面试·扩散模型·ddpm·数学原理
知识点1:DDPM数学原理及理解注1:本文系"视觉方向大厂面试·硬核通关"专栏文章。本专栏致力于对多模态大模型/CV领域的高频高难面试题进行深度拆解。本期攻克的难题是:DDPM(去噪扩散概率模型)的数学原理与推导。