【AI学习】扩散模型的一点思考:生成过程为什么要增加噪声项

前面学习了扩散模型,并做了总结PPT

其中有一个疑问:在生成过程中,就是下图的算法2中的第四步,为什么要在预测了噪声项后,Xt减去预测的噪声后,还有再叠加一个噪声项?就是增加的部分。

李宏毅的讲解中,指出,如果不增加这个噪声项,最后就无法有效生成图片。

这两天忽然想到,其实,在前向过程中,每一步都在叠加一个高斯噪声。而在反向过程,每一步都重新估计这个高斯噪声,然后减去预测的噪声,最终恢复图形。但是,看了公式推导我们知道,其实,每一步估计噪声,其实是估计的噪声的均值。如果每一步只是减去一个预测的噪声的均值,那反向过程的每一步就不是如前向过程一样去处理高斯噪声,毕竟均值是一个确定项。所以还要增加前面所说的噪声项目,让反向过程的每一步真正实现减去高斯噪声的目的。

相关推荐
墨北小七几秒前
YOLO:为什么机器人的“眼睛”,非它莫属?
人工智能·深度学习·神经网络
guslegend2 分钟前
第8节:打造可配置,可扩展的自动化预处理流水线
人工智能·大模型·rag
tinygone3 分钟前
从0开始基于Karpathy的理念搭建Wiki
人工智能·经验分享
Orange_sparkle5 分钟前
learn claude code学习记录-S01
学习·claude code
FluxMelodySun6 分钟前
机器学习(三十一) 半监督SVM与图半监督学习
人工智能·算法·机器学习
weixin_408099676 分钟前
【实战教程】EasyClick 调用 OCR 文字识别 API(自动识别屏幕文字 + 完整示例代码)
前端·人工智能·后端·ocr·api·安卓·easyclick
2301_764441336 分钟前
SleepFM多模态睡眠基础模型
人工智能·开源·github
想你依然心痛7 分钟前
HarmonyOS 5.0教育科技开发实战:构建AI个性化学习与分布式协同教育系统
人工智能·学习·harmonyos
管二狗赶快去工作!9 分钟前
体系结构论文(108):Large Language Models for EDA: Future or Mirage?
人工智能·机器学习
薛定猫AI11 分钟前
【技术干货】AI 编码代理行为优化:Andrej Karpathy Skills 工程实践指南
人工智能