全方差公式(Law of Total Variance)是概率论中一个重要的方差分解公式,形式如下。
全方差公式把随机变量 X的方差分解为条件方差的期望和条件期望的方差。
这里探索全方差公式的基本形式,以及在DDIM中的应用示例。所用示例参考和修改自网络资料。
1 全方差公式基本形式
1.1. 基本形式
对于随机变量X和Y,全方差公式为:
直观理解如下
总方差 = 平均条件方差 + 条件期望的方差
第一项:X在给定Y时的方差的平均值
第二项:X在给定Y时的期望的变化程度
全方差公式最重要的是带条件的版本,即在给定第三个变量Z时:
1.2 示例场景
考虑一个两阶段随机实验:
第一阶段:随机选择一个盒子。盒子1被选中的概率为p,盒子2被选中的概率为1-p。
第二阶段:从选中的盒子中随机抽取一个球,记录球上的数字。
已知:
盒子1:有3个球,数字分别为1、2、3,每个球等概率被抽中。
盒子2:有2个球,数字分别为4、5,每个球等概率被抽中。
定义随机变量:
Y:选择的盒子(Y=1或 2)
X:抽到的球上的数字
取p = 0.5,计算X的方差
1)直接计算
X的概率分布表示如下
在此基础上,计算和
然后计算
2)全方差公式计算
首先,计算条件期望
此时,相当于是一个随机变量,以概率p=0.5取值 2,以概率1-p=0.5取值 4.5。
其次,计算条件方差
因此,以概率0.5取值2/3,以概率0.5取值 0.25。
进一步,计算
进一步,计算
首先,。
其次,计算:
因此,
最后,代入全方差公式**
与直接计算结果一致。
1.3 公式含义
公式含义说明如下:
-:表示在给定
的条件下,
自身波动(盒内波动)的平均程度。
-:表示由于
的随机性导致的条件期望的波动(盒子间差异)。
全方差公式在统计分析中常用于分解方差来源,例如在方差分析(ANOVA)、混合效应模型等领域有重要应用。
2 全方差公式在DDIM的应用
2.1 DDIM推导中应用
在DDIM的问题中:
是目标变量
是中间变量
则是条件变量
DDIM的目的是计算
步骤1 理解公式结构
步骤2 计算第一项 - 平均条件方差
已知条件分布:
因此:
这是一个**常数**(不依赖于)。
计算期望:
无论取何值,条件方差都是
,所以平均仍然是
。
步骤3:计算第二项 - 条件期望的方差
参考DDIM的后验分布的公式,已知条件期望:
参考链接如下
https://blog.csdn.net/liliang199/article/details/156433365
关键结论是,给定,
是
的线性函数,所以
令:
则:
计算方差:
有DDPM的已知结论可知,给定,
的分布为:
参考链接如下
https://blog.csdn.net/liliang199/article/details/156341403
因此:
步骤4:合并两项
2.2 直观解释为什么分解
想象通过两步生成的过程
step1: 从生成
step2: 从生成
在这个过程中,总方差可以归纳为以下两个来源。
来源1:传播的随机性,第一步的随机性通过条件期望函数传播到第二步,这是条件期望的方差
来源2:内在随机性,第二步本身引入的随机性(),这是平均条件方差
具体来说,第一项,即使精确知道
,生成
时仍有的不确定性。
第二项 ,
由于本身是随机的,这个随机性通过线性变换
传播到
2.3. 与全期望公式的关系
全期望公式和全方差公式经常一起使用:
全期望公式:
全方差公式:
在DDIM推导中:
先用全期望公式验证均值正确性
见如下链接
https://blog.csdn.net/liliang199/article/details/156543402
再用全方差公式验证方差正确性
见2.1节推理过程
2.4 特殊情况验证
情况1:DDPM()
-
第一项:
-
第二项:
-
总和:
,与DDPM的结论一致。
情况2:DDIM确定性()
-
第一项:0
-
第二项:
-
总和:
,与DDPM的结论一致。
当时,所有随机性都来自第二项(
的随机性传播),而第二步本身是确定性的。
这个验证说明了
1)边缘分布一致性
无论如何选择,边缘分布
都与DDPM相同
2)训练兼容性
DDPM的训练目标只依赖于这些边缘分布,因此DDPM训练好的模型可以直接用于DDIM采样
3)设计自由度
可以自由选择来调整采样过程(随机性 vs 确定性),而不影响训练目标
全方差公式能够将复杂的边缘方差分解为两部分,分别对应生成过程中两个步骤的随机性贡献。
验证了DDIM设计的正确性,也揭示了不同随机性来源的作用,有助于理解扩散模型的采样过程。
reference
DDIM扩散模型改进采样策略的推理探索
https://blog.csdn.net/liliang199/article/details/156433365
DDPM前向加噪过程详细推导
https://blog.csdn.net/liliang199/article/details/156341403
全期望公式在DDIM中的应用实例