全方差公式在DDIM中的应用示例

全方差公式(Law of Total Variance)是概率论中一个重要的方差分解公式,形式如下。

全方差公式把随机变量 X的方差分解为条件方差的期望和条件期望的方差。

这里探索全方差公式的基本形式,以及在DDIM中的应用示例。所用示例参考和修改自网络资料。

1 全方差公式基本形式

1.1. 基本形式

对于随机变量X和Y,全方差公式为:

直观理解如下

  • 总方差 = 平均条件方差 + 条件期望的方差

  • 第一项:X在给定Y时的方差的平均值

  • 第二项:X在给定Y时的期望的变化程度

全方差公式最重要的是带条件的版本,即在给定第三个变量Z时:

1.2 示例场景

考虑一个两阶段随机实验:

第一阶段:随机选择一个盒子。盒子1被选中的概率为p,盒子2被选中的概率为1-p。

第二阶段:从选中的盒子中随机抽取一个球,记录球上的数字。

已知:

  • 盒子1:有3个球,数字分别为1、2、3,每个球等概率被抽中。

  • 盒子2:有2个球,数字分别为4、5,每个球等概率被抽中。

定义随机变量:

  • Y:选择的盒子(Y=1或 2)

  • X:抽到的球上的数字

取p = 0.5,计算X的方差

1)直接计算

X的概率分布表示如下

在此基础上,计算

然后计算

2)全方差公式计算

首先,计算条件期望

此时,相当于是一个随机变量,以概率p=0.5取值 2,以概率1-p=0.5取值 4.5。

其次,计算条件方差

因此,以概率0.5取值2/3,以概率0.5取值 0.25。

进一步,计算

进一步,计算

首先,

其次,计算

因此,

最后,代入全方差公式**

与直接计算结果一致。

1.3 公式含义

公式含义说明如下:

-:表示在给定的条件下,自身波动(盒内波动)的平均程度。

-:表示由于的随机性导致的条件期望的波动(盒子间差异)。

全方差公式在统计分析中常用于分解方差来源,例如在方差分析(ANOVA)、混合效应模型等领域有重要应用。

2 全方差公式在DDIM的应用

2.1 DDIM推导中应用

在DDIM的问题中:

是目标变量
是中间变量
则是条件变量

DDIM的目的是计算

步骤1 理解公式结构

步骤2 计算第一项 - 平均条件方差

已知条件分布:

因此:

这是一个**常数**(不依赖于)。

计算期望:

无论取何值,条件方差都是,所以平均仍然是

步骤3:计算第二项 - 条件期望的方差

参考DDIM的后验分布的公式,已知条件期望:

参考链接如下

https://blog.csdn.net/liliang199/article/details/156433365

关键结论是,给定的线性函数,所以

令:

则:

计算方差:

有DDPM的已知结论可知,给定的分布为:

参考链接如下

https://blog.csdn.net/liliang199/article/details/156341403

因此:

步骤4:合并两项

2.2 直观解释为什么分解

想象通过两步生成的过程

step1: 从生成

step2: 从生成

在这个过程中,总方差可以归纳为以下两个来源。

来源1:传播的随机性,第一步的随机性通过条件期望函数传播到第二步,这是条件期望的方差

来源2:内在随机性,第二步本身引入的随机性(),这是平均条件方差

具体来说,第一项,即使精确知道,生成时仍有的不确定性。

第二项

由于本身是随机的,这个随机性通过线性变换传播到

2.3. 与全期望公式的关系

全期望公式和全方差公式经常一起使用:

全期望公式:

全方差公式:

在DDIM推导中:

先用全期望公式验证均值正确性

见如下链接

https://blog.csdn.net/liliang199/article/details/156543402

再用全方差公式验证方差正确性

见2.1节推理过程

2.4 特殊情况验证

情况1:DDPM(

  • 第一项:

  • 第二项:

  • 总和:,与DDPM的结论一致。

情况2:DDIM确定性(

  • 第一项:0

  • 第二项:

  • 总和:,与DDPM的结论一致。

时,所有随机性都来自第二项(的随机性传播),而第二步本身是确定性的。

这个验证说明了

1)边缘分布一致性

无论如何选择,边缘分布都与DDPM相同

2)训练兼容性

DDPM的训练目标只依赖于这些边缘分布,因此DDPM训练好的模型可以直接用于DDIM采样

3)设计自由度

可以自由选择来调整采样过程(随机性 vs 确定性),而不影响训练目标

全方差公式能够将复杂的边缘方差分解为两部分,分别对应生成过程中两个步骤的随机性贡献。

验证了DDIM设计的正确性,也揭示了不同随机性来源的作用,有助于理解扩散模型的采样过程。

reference


DDIM扩散模型改进采样策略的推理探索

https://blog.csdn.net/liliang199/article/details/156433365

DDPM前向加噪过程详细推导

https://blog.csdn.net/liliang199/article/details/156341403

全期望公式在DDIM中的应用实例

https://blog.csdn.net/liliang199/article/details/156543402

相关推荐
AI科技星1 天前
张祥前统一场论核心场方程的经典验证-基于电子与质子的求导溯源及力的精确计算
线性代数·算法·机器学习·矩阵·概率论
Fleshy数模2 天前
从一条直线开始:线性回归的底层逻辑与实战
人工智能·机器学习·概率论
seeInfinite3 天前
面试常见数学概率题
概率论
木非哲5 天前
AB实验必修课(一):线性回归的深度重构与稳定性评估
线性回归·概率论·abtest
大江东去浪淘尽千古风流人物7 天前
【LingBot-Depth】Masked Depth Modeling for Spatial Perception
人工智能·算法·机器学习·概率论
闪闪发亮的小星星8 天前
主旋参数定义
算法·机器学习·概率论
辰尘_星启10 天前
[最优控制]MPC模型预测控制
线性代数·机器学习·机器人·概率论·控制·现代控制
passxgx10 天前
12.1 均值、方差与概率
算法·均值算法·概率论
Cathy Bryant11 天前
softmax函数与logits
笔记·神经网络·机器学习·概率论·信息与通信
墨上烟雨11 天前
古典概型与几何概型
概率论