扩散模型相关的概率论基础

一、期望(Expectation)

期望是对随机变量在分布下的"加权平均"。

离散情形:

连续情形(积分):

在连续随机变量里:概率不是"点的值",而是"密度函数",所以期望会变成积分形式:

求平均 = 所有可能值 × 它出现的概率密度

积分和期望的关系:连续情形下,期望本质上就是一个积分。p(x)是权重(概率密度),f(x)是被加权的函数。

等价于

因为想要的p(z∣x)很难算,所以用q(z∣x)来近似它

二、VAE/Diffusion 中反复出现的核心公式

1. 边际化(Marginalization)

这是 VAE 最核心的困难之处------这个积分对所有 z 都是 intractable 的。

2. 贝叶斯公式

VAE 用一个神经网络来这个难以计算的后验 p(z∣x):

这里编码器网络接收输入 x,输出两个值:

  • :隐变量的均值
  • :隐变量的标准差

ϕ就是这个网络的所有可学习参数,通过最大化 ELBO 来训练。

3. KL 散度

衡量两个分布"距离"的函数:

(z∼q:z服从q分布)

KL(q||p) = "用 q 作为权重,衡量 q 和 p 的差异"意思就是"如果数据是按照 q 分布出现的,

那 p 有多不匹配?"所以必须用q来采样(用 q 加权),不能用Ep,否则变成在模型生成的数据下评估误差。

展开就是:,ELBO 其实就是这个结构的变形!

,当且仅当 q=p时等于 0。

4. 蒙特卡洛估计(MC Estimation)

当积分无法解析计算时,用采样近似:

VAE 的重建项就是这样估计的(通常 N=1,因为batch 和多次迭代已经在平均了)。

原来的期望是

这是一个连续积分( 这个期望本质上是一个高维积分,而积分里的函数形式又非常复杂**)**,要对所有可能的 z 值加权求和------有无穷多个点。而蒙特卡洛估计只用了 N 离散的采样点:

用有限个离散样本替代了无穷连续的积分。

相关推荐
云和数据.ChenGuang1 天前
metrics的解释 人工智能
人工智能·深度学习·学习·机器学习·概率论
AI科技星2 天前
数术工坊 · 第四卷 橡皮泥江湖(拓扑学)【完整定稿】
c语言·开发语言·汇编·electron·概率论·拓扑学
AI科技星2 天前
第六卷:量天尺传奇(几何学)
网络·人工智能·算法·概率论·学习方法·几何学·拓扑学
AI科技星3 天前
数术江湖·全卷合集 - 硬核江湖・数理史诗
android·人工智能·架构·概率论·学习方法
AI科技星4 天前
第三卷:质数王朝志(全卷定稿)
c语言·开发语言·汇编·electron·概率论
AI科技星4 天前
第四卷:橡皮泥江湖(拓扑学)――诸同奥义,九同立境贯拓扑
网络·人工智能·线性代数·架构·概率论·学习方法·拓扑学
AI科技星4 天前
第三卷:质数王朝志 第四章:RSA护国玄阵,质数锁天地,一数镇万法
android·人工智能·架构·概率论·学习方法
AI科技星5 天前
《全域数学/数术工坊》体系总览
c语言·开发语言·汇编·electron·概率论
lhjcsubupt5 天前
第二十二篇 从随机过程到IMU噪声模型
算法·机器学习·概率论
做cv的小昊6 天前
计算机图形学:【Games101】学习笔记08——光线追踪(辐射度量学、渲染方程与全局光照、蒙特卡洛积分与路径追踪)
图像处理·笔记·学习·计算机视觉·游戏引擎·图形渲染·概率论