【AI学习】扩散模型的一点思考:生成过程为什么要增加噪声项

前面学习了扩散模型,并做了总结PPT

其中有一个疑问:在生成过程中,就是下图的算法2中的第四步,为什么要在预测了噪声项后,Xt减去预测的噪声后,还有再叠加一个噪声项?就是增加的部分。

李宏毅的讲解中,指出,如果不增加这个噪声项,最后就无法有效生成图片。

这两天忽然想到,其实,在前向过程中,每一步都在叠加一个高斯噪声。而在反向过程,每一步都重新估计这个高斯噪声,然后减去预测的噪声,最终恢复图形。但是,看了公式推导我们知道,其实,每一步估计噪声,其实是估计的噪声的均值。如果每一步只是减去一个预测的噪声的均值,那反向过程的每一步就不是如前向过程一样去处理高斯噪声,毕竟均值是一个确定项。所以还要增加前面所说的噪声项目,让反向过程的每一步真正实现减去高斯噪声的目的。

相关推荐
大写-凌祁3 小时前
零基础入门深度学习:从理论到实战,GitHub+开源资源全指南(2025最新版)
人工智能·深度学习·开源·github
焦耳加热4 小时前
阿德莱德大学Nat. Commun.:盐模板策略实现废弃塑料到单原子催化剂的高值转化,推动环境与能源催化应用
人工智能·算法·机器学习·能源·材料工程
深空数字孪生4 小时前
储能调峰新实践:智慧能源平台如何保障风电消纳与电网稳定?
大数据·人工智能·物联网
wan5555cn4 小时前
多张图片生成视频模型技术深度解析
人工智能·笔记·深度学习·算法·音视频
Broken Arrows5 小时前
Linux学习——管理网络安全(二十一)
linux·学习·web安全
格林威5 小时前
机器视觉检测的光源基础知识及光源选型
人工智能·深度学习·数码相机·yolo·计算机视觉·视觉检测
今天也要学习吖5 小时前
谷歌nano banana官方Prompt模板发布,解锁六大图像生成风格
人工智能·学习·ai·prompt·nano banana·谷歌ai
Hello123网站5 小时前
glean-企业级AI搜索和知识发现平台
人工智能·产品运营·ai工具
AKAMAI5 小时前
Queue-it 为数十亿用户增强在线体验
人工智能·云原生·云计算