全方差公式在DDIM中的应用示例

liliangcsdn2026-01-05 17:34

全方差公式（Law of Total Variance）是概率论中一个重要的方差分解公式，形式如下。

全方差公式把随机变量 X的方差分解为条件方差的期望和条件期望的方差。

这里探索全方差公式的基本形式，以及在DDIM中的应用示例。所用示例参考和修改自网络资料。

1 全方差公式基本形式

1.1. 基本形式

对于随机变量X和Y，全方差公式为：

直观理解如下

总方差 = 平均条件方差 + 条件期望的方差

第一项：X在给定Y时的方差的平均值

第二项：X在给定Y时的期望的变化程度

全方差公式最重要的是带条件的版本，即在给定第三个变量Z时：

1.2 示例场景

考虑一个两阶段随机实验：

第一阶段：随机选择一个盒子。盒子1被选中的概率为p，盒子2被选中的概率为1-p。

第二阶段：从选中的盒子中随机抽取一个球，记录球上的数字。

已知：

盒子1：有3个球，数字分别为1、2、3，每个球等概率被抽中。

盒子2：有2个球，数字分别为4、5，每个球等概率被抽中。

定义随机变量：

Y：选择的盒子（Y=1或 2）

X：抽到的球上的数字

取p = 0.5，计算X的方差

1）直接计算

X的概率分布表示如下

在此基础上，计算和

然后计算

2）全方差公式计算

首先，计算条件期望

此时，相当于是一个随机变量，以概率p=0.5取值 2，以概率1-p=0.5取值 4.5。

其次，计算条件方差

因此，以概率0.5取值2/3，以概率0.5取值 0.25。

进一步，计算

进一步，计算

首先，。

其次，计算：

因此，

最后，代入全方差公式**

与直接计算结果一致。

1.3 公式含义

公式含义说明如下：

-：表示在给定的条件下，自身波动（盒内波动）的平均程度。

-：表示由于的随机性导致的条件期望的波动（盒子间差异）。

全方差公式在统计分析中常用于分解方差来源，例如在方差分析（ANOVA）、混合效应模型等领域有重要应用。

2 全方差公式在DDIM的应用

2.1 DDIM推导中应用

在DDIM的问题中：

是目标变量
是中间变量
则是条件变量

DDIM的目的是计算

步骤1 理解公式结构

步骤2 计算第一项 - 平均条件方差

已知条件分布：

因此：

这是一个**常数**（不依赖于）。

计算期望：

无论取何值，条件方差都是，所以平均仍然是。

步骤3：计算第二项 - 条件期望的方差

参考DDIM的后验分布的公式，已知条件期望：

参考链接如下

https://blog.csdn.net/liliang199/article/details/156433365

关键结论是，给定，是的线性函数，所以

令：

则：

计算方差：

有DDPM的已知结论可知，给定，的分布为：

参考链接如下

https://blog.csdn.net/liliang199/article/details/156341403

因此：

步骤4：合并两项

2.2 直观解释为什么分解

想象通过两步生成的过程

step1: 从生成

step2: 从生成

在这个过程中，总方差可以归纳为以下两个来源。

来源1：传播的随机性，第一步的随机性通过条件期望函数传播到第二步，这是条件期望的方差

来源2：内在随机性，第二步本身引入的随机性（），这是平均条件方差

具体来说，第一项，即使精确知道，生成时仍有的不确定性。

第二项，

由于本身是随机的，这个随机性通过线性变换传播到

2.3. 与全期望公式的关系

全期望公式和全方差公式经常一起使用：

全期望公式：

全方差公式：

在DDIM推导中：

先用全期望公式验证均值正确性

见如下链接

https://blog.csdn.net/liliang199/article/details/156543402

再用全方差公式验证方差正确性

见2.1节推理过程

2.4 特殊情况验证

情况1：DDPM（）

第一项：
第二项：
总和：，与DDPM的结论一致。

情况2：DDIM确定性（）

第一项：0
第二项：
总和：，与DDPM的结论一致。

当时，所有随机性都来自第二项（的随机性传播），而第二步本身是确定性的。

这个验证说明了

1）边缘分布一致性

无论如何选择，边缘分布都与DDPM相同

2）训练兼容性

DDPM的训练目标只依赖于这些边缘分布，因此DDPM训练好的模型可以直接用于DDIM采样

3）设计自由度

可以自由选择来调整采样过程（随机性 vs 确定性），而不影响训练目标

全方差公式能够将复杂的边缘方差分解为两部分，分别对应生成过程中两个步骤的随机性贡献。

验证了DDIM设计的正确性，也揭示了不同随机性来源的作用，有助于理解扩散模型的采样过程。

reference

DDIM扩散模型改进采样策略的推理探索

https://blog.csdn.net/liliang199/article/details/156433365

DDPM前向加噪过程详细推导

https://blog.csdn.net/liliang199/article/details/156341403

全期望公式在DDIM中的应用实例

https://blog.csdn.net/liliang199/article/details/156543402

上一篇：AI渗透工具—Shannon完全自主的AI渗透测试工具

下一篇：【agent-lightning】 - 2_使用 Agent-lightning 训练第一个智能体

热门推荐

01GitHub 镜像站点 02【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 03OpenClaw 使用和管理 MCP 完全指南 04Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 05Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 06AI Agent 平台横评：ZeroClaw vs OpenClaw vs Nanobot 07AI 规范驱动开发“三剑客”深度对比：Spec-Kit、Kiro 与 OpenSpec 实战指南 08Window 10部署openclaw报错node.exe : npm error code 128 09OpenClaw + 飞书（Feishu）环境搭建指南 10本地部署 OpenClaw + DeepSeek-R1 完全指南