全方差公式在DDIM中的应用示例

全方差公式(Law of Total Variance)是概率论中一个重要的方差分解公式,形式如下。

全方差公式把随机变量 X的方差分解为条件方差的期望和条件期望的方差。

这里探索全方差公式的基本形式,以及在DDIM中的应用示例。所用示例参考和修改自网络资料。

1 全方差公式基本形式

1.1. 基本形式

对于随机变量X和Y,全方差公式为:

直观理解如下

  • 总方差 = 平均条件方差 + 条件期望的方差

  • 第一项:X在给定Y时的方差的平均值

  • 第二项:X在给定Y时的期望的变化程度

全方差公式最重要的是带条件的版本,即在给定第三个变量Z时:

1.2 示例场景

考虑一个两阶段随机实验:

第一阶段:随机选择一个盒子。盒子1被选中的概率为p,盒子2被选中的概率为1-p。

第二阶段:从选中的盒子中随机抽取一个球,记录球上的数字。

已知:

  • 盒子1:有3个球,数字分别为1、2、3,每个球等概率被抽中。

  • 盒子2:有2个球,数字分别为4、5,每个球等概率被抽中。

定义随机变量:

  • Y:选择的盒子(Y=1或 2)

  • X:抽到的球上的数字

取p = 0.5,计算X的方差

1)直接计算

X的概率分布表示如下

在此基础上,计算

然后计算

2)全方差公式计算

首先,计算条件期望

此时,相当于是一个随机变量,以概率p=0.5取值 2,以概率1-p=0.5取值 4.5。

其次,计算条件方差

因此,以概率0.5取值2/3,以概率0.5取值 0.25。

进一步,计算

进一步,计算

首先,

其次,计算

因此,

最后,代入全方差公式**

与直接计算结果一致。

1.3 公式含义

公式含义说明如下:

-:表示在给定的条件下,自身波动(盒内波动)的平均程度。

-:表示由于的随机性导致的条件期望的波动(盒子间差异)。

全方差公式在统计分析中常用于分解方差来源,例如在方差分析(ANOVA)、混合效应模型等领域有重要应用。

2 全方差公式在DDIM的应用

2.1 DDIM推导中应用

在DDIM的问题中:

是目标变量
是中间变量
则是条件变量

DDIM的目的是计算

步骤1 理解公式结构

步骤2 计算第一项 - 平均条件方差

已知条件分布:

因此:

这是一个**常数**(不依赖于)。

计算期望:

无论取何值,条件方差都是,所以平均仍然是

步骤3:计算第二项 - 条件期望的方差

参考DDIM的后验分布的公式,已知条件期望:

参考链接如下

https://blog.csdn.net/liliang199/article/details/156433365

关键结论是,给定的线性函数,所以

令:

则:

计算方差:

有DDPM的已知结论可知,给定的分布为:

参考链接如下

https://blog.csdn.net/liliang199/article/details/156341403

因此:

步骤4:合并两项

2.2 直观解释为什么分解

想象通过两步生成的过程

step1: 从生成

step2: 从生成

在这个过程中,总方差可以归纳为以下两个来源。

来源1:传播的随机性,第一步的随机性通过条件期望函数传播到第二步,这是条件期望的方差

来源2:内在随机性,第二步本身引入的随机性(),这是平均条件方差

具体来说,第一项,即使精确知道,生成时仍有的不确定性。

第二项

由于本身是随机的,这个随机性通过线性变换传播到

2.3. 与全期望公式的关系

全期望公式和全方差公式经常一起使用:

全期望公式:

全方差公式:

在DDIM推导中:

先用全期望公式验证均值正确性

见如下链接

https://blog.csdn.net/liliang199/article/details/156543402

再用全方差公式验证方差正确性

见2.1节推理过程

2.4 特殊情况验证

情况1:DDPM(

  • 第一项:

  • 第二项:

  • 总和:,与DDPM的结论一致。

情况2:DDIM确定性(

  • 第一项:0

  • 第二项:

  • 总和:,与DDPM的结论一致。

时,所有随机性都来自第二项(的随机性传播),而第二步本身是确定性的。

这个验证说明了

1)边缘分布一致性

无论如何选择,边缘分布都与DDPM相同

2)训练兼容性

DDPM的训练目标只依赖于这些边缘分布,因此DDPM训练好的模型可以直接用于DDIM采样

3)设计自由度

可以自由选择来调整采样过程(随机性 vs 确定性),而不影响训练目标

全方差公式能够将复杂的边缘方差分解为两部分,分别对应生成过程中两个步骤的随机性贡献。

验证了DDIM设计的正确性,也揭示了不同随机性来源的作用,有助于理解扩散模型的采样过程。

reference


DDIM扩散模型改进采样策略的推理探索

https://blog.csdn.net/liliang199/article/details/156433365

DDPM前向加噪过程详细推导

https://blog.csdn.net/liliang199/article/details/156341403

全期望公式在DDIM中的应用实例

https://blog.csdn.net/liliang199/article/details/156543402

相关推荐
Cathy Bryant5 分钟前
softmax函数与logits
笔记·神经网络·机器学习·概率论·信息与通信
墨上烟雨33 分钟前
古典概型与几何概型
概率论
点云SLAM20 小时前
似然函数(Likelihood Function)和最大似然估计
算法·机器学习·概率论·数理统计·最大似然估计·似然函数·概率分布
Figo_Cheung21 小时前
Figo几何基础论:基于集合几何化的统一理论框架与哲学意涵——首次提出“几何化诱导的全息原理”
算法·机器学习·概率论·迭代加深
木非哲1 天前
AB实验的关键认知(十四)实验复盘与总结
概率论·abtest
无风听海1 天前
负对数似然函数详解
概率论
AI科技星1 天前
加速运动正电荷产生加速度反向引力场的详细求导过程
人工智能·线性代数·算法·机器学习·矩阵·概率论
木非哲2 天前
AB实验的关键认知(十一)A/A实验
概率论·abtest
木非哲2 天前
AB实验的关键认知(十二)黄金时刻-最大统计功效阶段-MPR
概率论·abtest
larance3 天前
先验概率、似然概率与后验概率详解
概率论