全方差公式在DDIM中的应用示例

全方差公式(Law of Total Variance)是概率论中一个重要的方差分解公式,形式如下。

全方差公式把随机变量 X的方差分解为条件方差的期望和条件期望的方差。

这里探索全方差公式的基本形式,以及在DDIM中的应用示例。所用示例参考和修改自网络资料。

1 全方差公式基本形式

1.1. 基本形式

对于随机变量X和Y,全方差公式为:

直观理解如下

  • 总方差 = 平均条件方差 + 条件期望的方差

  • 第一项:X在给定Y时的方差的平均值

  • 第二项:X在给定Y时的期望的变化程度

全方差公式最重要的是带条件的版本,即在给定第三个变量Z时:

1.2 示例场景

考虑一个两阶段随机实验:

第一阶段:随机选择一个盒子。盒子1被选中的概率为p,盒子2被选中的概率为1-p。

第二阶段:从选中的盒子中随机抽取一个球,记录球上的数字。

已知:

  • 盒子1:有3个球,数字分别为1、2、3,每个球等概率被抽中。

  • 盒子2:有2个球,数字分别为4、5,每个球等概率被抽中。

定义随机变量:

  • Y:选择的盒子(Y=1或 2)

  • X:抽到的球上的数字

取p = 0.5,计算X的方差

1)直接计算

X的概率分布表示如下

在此基础上,计算

然后计算

2)全方差公式计算

首先,计算条件期望

此时,相当于是一个随机变量,以概率p=0.5取值 2,以概率1-p=0.5取值 4.5。

其次,计算条件方差

因此,以概率0.5取值2/3,以概率0.5取值 0.25。

进一步,计算

进一步,计算

首先,

其次,计算

因此,

最后,代入全方差公式**

与直接计算结果一致。

1.3 公式含义

公式含义说明如下:

-:表示在给定的条件下,自身波动(盒内波动)的平均程度。

-:表示由于的随机性导致的条件期望的波动(盒子间差异)。

全方差公式在统计分析中常用于分解方差来源,例如在方差分析(ANOVA)、混合效应模型等领域有重要应用。

2 全方差公式在DDIM的应用

2.1 DDIM推导中应用

在DDIM的问题中:

是目标变量
是中间变量
则是条件变量

DDIM的目的是计算

步骤1 理解公式结构

步骤2 计算第一项 - 平均条件方差

已知条件分布:

因此:

这是一个**常数**(不依赖于)。

计算期望:

无论取何值,条件方差都是,所以平均仍然是

步骤3:计算第二项 - 条件期望的方差

参考DDIM的后验分布的公式,已知条件期望:

参考链接如下

https://blog.csdn.net/liliang199/article/details/156433365

关键结论是,给定的线性函数,所以

令:

则:

计算方差:

有DDPM的已知结论可知,给定的分布为:

参考链接如下

https://blog.csdn.net/liliang199/article/details/156341403

因此:

步骤4:合并两项

2.2 直观解释为什么分解

想象通过两步生成的过程

step1: 从生成

step2: 从生成

在这个过程中,总方差可以归纳为以下两个来源。

来源1:传播的随机性,第一步的随机性通过条件期望函数传播到第二步,这是条件期望的方差

来源2:内在随机性,第二步本身引入的随机性(),这是平均条件方差

具体来说,第一项,即使精确知道,生成时仍有的不确定性。

第二项

由于本身是随机的,这个随机性通过线性变换传播到

2.3. 与全期望公式的关系

全期望公式和全方差公式经常一起使用:

全期望公式:

全方差公式:

在DDIM推导中:

先用全期望公式验证均值正确性

见如下链接

https://blog.csdn.net/liliang199/article/details/156543402

再用全方差公式验证方差正确性

见2.1节推理过程

2.4 特殊情况验证

情况1:DDPM(

  • 第一项:

  • 第二项:

  • 总和:,与DDPM的结论一致。

情况2:DDIM确定性(

  • 第一项:0

  • 第二项:

  • 总和:,与DDPM的结论一致。

时,所有随机性都来自第二项(的随机性传播),而第二步本身是确定性的。

这个验证说明了

1)边缘分布一致性

无论如何选择,边缘分布都与DDPM相同

2)训练兼容性

DDPM的训练目标只依赖于这些边缘分布,因此DDPM训练好的模型可以直接用于DDIM采样

3)设计自由度

可以自由选择来调整采样过程(随机性 vs 确定性),而不影响训练目标

全方差公式能够将复杂的边缘方差分解为两部分,分别对应生成过程中两个步骤的随机性贡献。

验证了DDIM设计的正确性,也揭示了不同随机性来源的作用,有助于理解扩散模型的采样过程。

reference


DDIM扩散模型改进采样策略的推理探索

https://blog.csdn.net/liliang199/article/details/156433365

DDPM前向加噪过程详细推导

https://blog.csdn.net/liliang199/article/details/156341403

全期望公式在DDIM中的应用实例

https://blog.csdn.net/liliang199/article/details/156543402

相关推荐
helloworld也报错?2 天前
深度强化学习(1)——基础知识(名词解释,概率论基础,蒙特卡洛采样,马尔可夫决策过程)
人工智能·深度学习·机器学习·概率论
liliangcsdn3 天前
全期望公式在DDIM中的应用实例
算法·机器学习·概率论
surtr14 天前
【算法自用】一些比较有趣的题目
算法·动态规划·概率论·图论
natide6 天前
表示/嵌入差异-4-闵可夫斯基距离(Minkowski Distance-曼哈顿距离-欧氏距离-切比雪夫距离
人工智能·深度学习·算法·机器学习·自然语言处理·概率论
忧郁奔向冷的天9 天前
泊松分布与指数分布以及一道贝叶斯推断例题
概率论
EniacCheng11 天前
贝叶斯定理
人工智能·机器学习·概率论
EniacCheng11 天前
二项分布和泊松分布
概率论·泊松分布·二项分布
byzh_rc12 天前
[模式识别-从入门到入土] 组合分类器
人工智能·算法·机器学习·支持向量机·概率论
牧歌悠悠13 天前
【Random Matrices】第一章-随机矩阵入门
线性代数·数学·概率论·随机矩阵·高维概率