【概率论】条件期望

在高等概率论中,给定一个概率空间 ( Ω , F , P ) (\Omega, \mathcal{F}, P) (Ω,F,P) 和其子 σ \sigma σ-代数 G ⊆ F \mathcal{G} \subseteq \mathcal{F} G⊆F,随机变量 X X X 关于 G \mathcal{G} G 的 条件期望 E [ X ∣ G ] E[X|\mathcal{G}] E[X∣G] 是一个满足以下两个条件的随机变量:

  1. G \mathcal{G} G-可测性 : E [ X ∣ G ] \mathbb{E}[X|\mathcal{G}] E[X∣G] 是 G \mathcal{G} G-可测的函数。
  2. 积分等式 :对任意 A ∈ G A \in \mathcal{G} A∈G,有
    ∫ A E [ X ∣ G ]   d P = ∫ A X   d P . \int_A \mathbb{E}[X|\mathcal{G}] \, dP = \int_A X \, dP. ∫AE[X∣G]dP=∫AXdP.

关键点解析:

存在性与唯一性 :由Radon-Nikodym定理保证, E [ X ∣ G ] \mathbb{E}[X|\mathcal{G}] E[X∣G] 在几乎必然意义下唯一存在。

直观意义 : E [ X ∣ G ] \mathbb{E}[X|\mathcal{G}] E[X∣G] 是在已知 G \mathcal{G} G 所包含的信息(即 G \mathcal{G} G-可测事件)时,对 X X X 的"最佳预测"。

特例 :若 G = σ ( Y ) \mathcal{G} = \sigma(Y) G=σ(Y) 由另一个随机变量生成,则 E [ X ∣ G ] \mathbb{E}[X|\mathcal{G}] E[X∣G] 可记为 E [ X ∣ Y ] \mathbb{E}[X|Y] E[X∣Y],表示给定 Y Y Y 时 X X X 的期望。

与其他定义的关联:

• 若 ( X , Y ) (X,Y) (X,Y) 有联合密度 f ( x , y ) f(x,y) f(x,y),则 E [ X ∣ Y = y ] = ∫ x f ( x ∣ y ) d x = ∫ x f ( x , y ) d x ∫ f ( x , y ) d x \mathbb{E}[X|Y=y] = \int x f(x|y) dx=\frac{\int x f(x,y) dx}{\int f(x,y) dx} E[X∣Y=y]=∫xf(x∣y)dx=∫f(x,y)dx∫xf(x,y)dx,其中 f ( x ∣ y ) f(x|y) f(x∣y) 为条件密度。测度论定义将此推广到更一般的场景,因此条件期望 E [ X ∣ Y = y ] \mathbb{E}[X|Y=y] E[X∣Y=y] 是关于 y y y 的函数。

性质:

条件期望具有线性性、单调性、塔性质(迭代期望)等,例如:

线性性 : E [ a X + b Y ∣ G ] = a E [ X ∣ G ] + b E [ Y ∣ G ] \mathbb{E}[aX + bY | \mathcal{G}] = a\mathbb{E}[X|\mathcal{G}] + b\mathbb{E}[Y|\mathcal{G}] E[aX+bY∣G]=aE[X∣G]+bE[Y∣G]。

塔性质 :若 H ⊆ G \mathcal{H} \subseteq \mathcal{G} H⊆G,则 E [ E [ X ∣ G ] ∣ H ] = E [ E [ X ∣ H ] ∣ G ] = E [ X ∣ H ] \mathbb{E}[\mathbb{E}[X|\mathcal{G}]|\mathcal{H}] =\mathbb{E}[\mathbb{E}[X|\mathcal{H}]|\mathcal{G}] = \mathbb{E}[X|\mathcal{H}] E[E[X∣G]∣H]=E[E[X∣H]∣G]=E[X∣H]。

数学期望与条件期望 E [ E [ X ∣ G ] ] = E [ X ] \mathbb{E}[\mathbb{E}[X|\mathcal{G}]] = \mathbb{E}[X] E[E[X∣G]]=E[X]。

相关推荐
HappyAcmen1 天前
1.3 古典概型和几何概型
笔记·概率论·学习方法
程序员老周6662 天前
4.大语言模型预备数学知识
人工智能·神经网络·线性代数·自然语言处理·大语言模型·概率论·数学基础
pen-ai3 天前
【统计方法】蒙特卡洛
人工智能·机器学习·概率论
phoenix@Capricornus4 天前
极大似然估计例题——正态分布的极大似然估计
线性代数·概率论
VU-zFaith8704 天前
C++概率论算法详解:理论基础与实践应用
c++·算法·概率论
zyq~6 天前
【课堂笔记】标签传播算法Label Propagation Algorithm(LPA)
人工智能·笔记·算法·机器学习·概率论·lpa·半监督学习
小于小于大橙子8 天前
强化学习的前世今生(五)— SAC算法
人工智能·算法·ai·自动驾驶·概率论·强化学习
zyq~9 天前
【课堂笔记】EM算法
人工智能·笔记·算法·机器学习·概率论·gmm·em算法
无水先生13 天前
【概率论基本概念01】点估计
概率论
拾忆-eleven14 天前
NLP学习路线图(二): 概率论与统计学(贝叶斯定理、概率分布等)
学习·自然语言处理·概率论