扩散模型

这张生成的图像能检测吗6 天前
pytorch·深度学习·机器学习·计算机视觉·3d·三维重建·扩散模型
Wonder3D: 跨域扩散的单图像3D重建技术论文题目:Wonder3D: Single Image to 3D using Cross-Domain Diffusion(Wonder3D:单图像到3D使用跨域扩散)
海边夕阳20067 天前
人工智能·经验分享·深度学习·机器学习·扩散模型
【每天一个AI小知识】:什么是扩散模型?目录一、小张的插画创作困境:从故事说起二、扩散模型的基本概念2.1 什么是扩散模型?2.2 扩散模型的特点
Echo_NGC22379 天前
人工智能·深度学习·神经网络·扩散模型·ddpm·高斯噪声
【DDPM 扩散模型】Part 7:最后总结!Denoising Diffusion Probabilistic Models论文全维度详解这是整个扩散模型体系从「基础 → 全局」的总结。 希望这篇文章能够让你真正理解DDPM扩散模型包含两个过程:
豆芽8199 天前
人工智能·神经网络·计算机视觉·视觉检测·扩散模型
计算机视觉:异常检测(paper with code汇总更新中)本文汇总异常检测相关论文,持续更新,所有内容均为开源,欢迎交流学习!待更新[爱心][爱心][爱心]
JOYCE_Leo1610 天前
深度学习·扩散模型·图像复原
Learning Diffusion Texture Priors for Image Restoration(DTPM)-CVPR2024Paper:论文地址Code:Coming SoonBaseline:DDPM前言一、整体框架3.3. Stage I: Learning Diffusion Texture Priors
吐个泡泡v12 天前
stable diffusion·transformer·扩散模型·ddpm·dit
扩散模型详解:从DDPM到Stable Diffusion再到DiT的技术演进扩散模型(Diffusion Models)作为当前最热门的生成模型之一,已彻底改变图像生成领域,本文从DDPM开始,逐步深入到Stable Diffusion和DiT架构。
李加号pluuuus18 天前
扩散模型
【扩散基础】基于分数的扩散模型(Score-Based Diffusion Model)高斯分布下:噪声 ϵ 和 score 的关系
AI生成未来19 天前
人工智能·扩散模型·视频编辑·视频生成
ICCV 2025 | 北大王选所推出AnyPortal:像素级操控视频背景,前景细节100%保留!文章链接:https://arxiv.org/pdf/2509.07472 主页:https://gaowenshuo.github.io/AnyPortal/ Git链接:https://github.com/gaowenshuo/AnyPortalCode
m0_6501082420 天前
论文阅读·扩散模型·端到端自动驾驶·阶段扩散策略·高级联扩散解码器·cvpr2025
DiffusionDrive:面向端到端自动驾驶的截断扩散模型在端到端自动驾驶领域,传统扩散模型应用面临计算开销大、模态坍缩问题,现有多模态规划方法依赖大量锚点。华中科技大学与地平线机器人团队提出的 DiffusionDrive,创新设计截断扩散策略(锚定高斯分布 + 2 步去噪)与级联扩散解码器,在 NAVSIM 达 88.1 PDMS,NVIDIA 4090 上 45 FPS,兼顾性能与实时性。
AI生成未来20 天前
aigc·扩散模型·视频生成·长视频
南洋理工&腾讯最新Rolling Forcing解决流视频生成长期误差累积,连贯如一且长达数分钟!论文链接:https://arxiv.org/pdf/2509.25161 项目链接:https://kunhao-liu.github.io/Rolling_Forcing_Webpage/
m0_6501082420 天前
自动驾驶·扩散模型·多模态融合·端到端规划·混合稀疏-稠密感知模块·vlm命令引导·截断扩散
DiffVLA:视觉语言引导的扩散规划在自动驾驶中的创新与实践在端到端自动驾驶领域,BEV 计算昂贵、动作多样性不足及复杂场景次优决策是关键挑战。RB 团队(Bosch、清华大学等联合)提出 DiffVLA 框架,融合 VLM 引导、混合稀疏 - 稠密感知与扩散规划模块,在 NavSim v2 私有测试集获 45.0 扩展 PDMS,2025 自动驾驶挑战赛表现优异,为端到端自动驾驶提供高效解决方案。
人邮异步社区22 天前
人工智能·学习·程序员·扩散模型
想要系统地学习扩散模型,应该怎么去做?学习扩散模型,推荐这本《扩散模型——核心原理与强化学习优化》。本书通过系统化的理论讲解与实战导向的案例分析,帮助读者掌握扩散模型与强化学习的结合应用,探索其针对实际问题的解决方案。书中首先介绍了生成模型的发展史,特别是扩散模型的起源和核心思想,为读者学习后续章节奠定基础;然后深入探讨了扩散模型在构建决策智能体、结合价值函数等方面的应用,还详细讲解了如何利用扩散模型解决轨迹优化和策略优化等问题;接下来探索了扩散模型在多任务泛化和世界模型建模方面的扩展应用,展示了其在复杂环境中的适应性和灵活性;最后讨论了利用
PixelMind1 个月前
人工智能·生成对抗网络·扩散模型·图像复原
【超分辨率专题】HYPIR:扩散模型先验与 GAN 对抗训练相结合的新型图像复原框架本文将对《Harnessing diffusion-Yielded Score Prior for Image Restoration》这篇文章进行解读,该文提出了一种新的图像修复框架,其核心思想是“用预训练扩散模型初始化,再用对抗训练微调”。出自超分领域有名的团队,XPixelGroup。参考资料如下: 参考资料如下: [1]. 论文地址 [2]. 代码地址
m0_650108242 个月前
人工智能·扩散模型·论文精读·视频修复·时序一致性·任意时长·结构引导
【论文精读】AVID:基于扩散模型的任意长度视频修复标题:AVID: Any-Length Video Inpainting with Diffusion Model
m0_650108242 个月前
扩散模型·论文精读·定制化视频生成·主体学习与动作学习·轻量级适配器·文本引导生成·阿里千问实验室
【论文精读】DreamVideo:定制化主体与动作的视频生成技术标题:DreamVideo: Composing Your Dream Videos with Customized Subject and Motion
m0_650108242 个月前
aigc·扩散模型·论文精读·音频到视频生成·会说话的头部·弱条件
【论文精读】EMO:弱条件下基于 Audio2Video 扩散模型的表情肖像视频生成标题:EMO: Emote Portrait Alive - Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions
m0_650108242 个月前
aigc·扩散模型·论文精读·分治策略·文本到视频生成
【论文精读】MicroCinema:基于分治策略的文本到视频生成新框架标题:MicroCinema: A Divide-and-Conquer Approach for Text-to-Video Generation
m0_650108242 个月前
aigc·扩散模型·论文精读·时空transformer·文本到视频生成·视频生成效率优化
【论文精读】Snap Video:面向文本到视频生成的规模化时空 Transformer标题:Snap Video: Scaled Spatiotemporal Transformers for Text-to-Video Synthesis
Small___ming2 个月前
论文阅读·人工智能·扩散模型·生成式人工智能
【论文笔记】扩散模型——如何通俗理解传统概率模型的核心矛盾灵活性 = 模型能拟合复杂数据的能力 可处理性 = 模型能进行高效计算的能力这两个目标往往相互冲突,就像"既要马儿跑,又要马儿不吃草"。
m0_650108242 个月前
计算机视觉·扩散模型·零样本学习·论文精读·文本条件图像到视频生成
【论文精读】TI2V-Zero:零样本图像引导的文本到视频生成技术标题:TI2V-Zero: Zero-Shot Image Conditioning for Text-to-Video Diffusion Models