扩散模型(Diffusion Models)
定义与原理:
扩散模型是一种基于概率论的生成模型,源自物理学中的扩散过程理论(如墨水在水中的扩散)。
在机器学习领域,扩散模型通过模拟数据从原始分布到噪声分布的"扩散"过程,并学习其逆过程来从噪声中重构高质量的数据样本。
核心过程:
正向扩散:将清晰的数据(如图像)通过一系列步骤逐渐添加噪声,转化为类似高斯噪声的状态。这一过程旨在简化数据结构,便于存储与传输,并在模型训练中起到基石作用。
反向扩散:从纯粹的噪声数据中逆向提炼、再生出清晰、有意义的图像或数据结构。这是通过一系列逆步骤逐步"去噪",最终生成接近原始数据分布的样本。