《小白学随机过程》第一章:随机过程——定义和形式 (附录1 探究随机变量)

深入理解概率空间与随机变量:从直观到数学


一、通俗理解:用"抛硬币"讲清楚基本概念

1.1 基本事件(Elementary Outcome)

想象你抛一枚硬币一次。可能出现的结果只有两种:

  • 正面(记为 H)
  • 反面(记为 T)

每一个不可再分的、确定的结果 ,就叫一个基本事件(或样本点)。

✅ 在这个例子中,基本事件有两个:H 和 T。

1.2 样本空间(Sample Space)Ω\OmegaΩ

所有可能的基本事件组成的集合,称为样本空间 ,记作 Ω\OmegaΩ。

  • 抛一次硬币:Ω={H,T}\Omega = \{H, T\}Ω={H,T}
  • 掷一个骰子:Ω={1,2,3,4,5,6}\Omega = \{1, 2, 3, 4, 5, 6\}Ω={1,2,3,4,5,6}
  • 测量明天的气温(连续):Ω=R\Omega = \mathbb{R}Ω=R(或某个区间,如 [−50,50][-50, 50][−50,50])

🌟 样本空间 = 所有可能结果组成的集合

1.3 事件(Event)和 事件域(σ\sigmaσ-代数)F\mathcal{F}F

现实中我们关心的往往不是单个结果,而是一类结果的集合,这个集合叫做事件或事件集合。

  • "出现偶数点" → 事件 A={2,4,6}A = \{2, 4, 6\}A={2,4,6}
  • "硬币不是反面" → 事件 B={H}B = \{H\}B={H}
  • "气温高于 30°C" → 事件 C=(30,∞)C = (30, \infty)C=(30,∞)

⚠️ 注意:事件是样本空间的子集

但并不是样本空间所有子集都能被赋予"概率"(尤其在连续情形下) (这句话的详细解读以及反例证明,涉及到较多测度论的内容,在此不再展开,只需要记住这个结论即可),这就引出了事件域 的概念。(通过后面的解读我们知道,事件域就是能被赋予"概率"的事件的集合)

为了能一致地定义概率 ,我们需要一个满足特定规则的事件集合 族 F\mathcal{F}F,称为 σ\sigmaσ-代数(读作"西格玛代数")。

它必须满足三条规则:

  1. 包含全集 :Ω∈F\Omega \in \mathcal{F}Ω∈F
  2. 对补集封闭 :若 A∈FA \in \mathcal{F}A∈F,则 Ac=Ω∖A∈FA^c = \Omega \setminus A \in \mathcal{F}Ac=Ω∖A∈F
  3. 对可数并封闭 :若 A1,A2,⋯∈FA_1, A_2, \dots \in \mathcal{F}A1,A2,⋯∈F,则 ⋃n=1∞An∈F\bigcup_{n=1}^\infty A_n \in \mathcal{F}⋃n=1∞An∈F

💡 直观理解:F\mathcal{F}F 是我们"允许谈论概率"的所有事件的集合。

  • 离散情形(如骰子):F\mathcal{F}F 通常是 Ω\OmegaΩ 的所有子集(幂集)。
  • 连续情形(如实数):F\mathcal{F}F 通常是 Borel σ\sigmaσ-代数 (由所有开区间生成的最小 σ\sigmaσ-代数),记作 B(R)\mathcal{B}(\mathbb{R})B(R)。

1.5 概率测度(Probability Measure)PPP

概率测度 PPP 是一个函数 ,它给每个 A∈FA \in \mathcal{F}A∈F 赋予一个 [0,1][0,1][0,1] 之间的数,表示该事件发生的"可能性大小"。

它必须满足:

  1. 非负性 :P(A)≥0P(A) \geq 0P(A)≥0
  2. 规范性 :P(Ω)=1P(\Omega) = 1P(Ω)=1
  3. 可数可加性 (σ\sigmaσ-可加性):若 A1,A2,...A_1, A_2, \dotsA1,A2,... 互不相交,则
    P(⋃n=1∞An)=∑n=1∞P(An) P\left( \bigcup_{n=1}^\infty A_n \right) = \sum_{n=1}^\infty P(A_n) P(n=1⋃∞An)=n=1∑∞P(An)

✅ 例子(公平骰子):

  • P({1})=16P(\{1\}) = \frac{1}{6}P({1})=61

  • P(偶数)=P({2,4,6})=36=12P(\text{偶数}) = P(\{2,4,6\}) = \frac{3}{6} = \frac{1}{2}P(偶数)=P({2,4,6})=63=21
    ✅ 例子(非公平骰子):

  • P({1})=P({3})=P({5})=112P(\{1\}) = P(\{3\}) = P(\{5\}) = \frac{1}{12}P({1})=P({3})=P({5})=121

  • P(偶数)=P({2,4,6})=912=34P(\text{偶数}) = P(\{2,4,6\}) = \frac{9}{12} = \frac{3}{4}P(偶数)=P({2,4,6})=129=43
    PPP 是一个事件到[0,1][0, 1][0,1] 之间的映射!


二、概率空间:三位一体的数学框架

将上述三者组合起来,就构成了概率空间(Probability Space)

概率空间是一个三元组 (Ω,F,P)(\Omega, \mathcal{F}, P)(Ω,F,P),其中:

  • Ω\OmegaΩ:样本空间(所有可能结果)
  • F\mathcal{F}F:σ\sigmaσ-代数(所有可测事件)
  • PPP:概率测度(给事件赋概率)

这个框架由苏联数学家柯尔莫哥洛夫(Kolmogorov) 于1933年公理化建立,是现代概率论的基石。

🌰 实际应用举例

  • 金融风控 :Ω\OmegaΩ = 所有可能的市场路径;F\mathcal{F}F = 可观测的市场信息集合;PPP = 风险中性测度。
  • 机器学习 :数据点 (x,y)(x, y)(x,y) 被视为从某个未知概率空间中独立采样。
  • 通信系统 :噪声建模为定义在 (R,B(R),P)(\mathbb{R}, \mathcal{B}(\mathbb{R}), P)(R,B(R),P) 上的随机变量。

三、为什么说随机变量是一个可测函数?------引入随机变量

3.1 动机:从"事件"到"数值"

在实际问题中,比如掷骰子或者抛硬币,我们希望把诸如

  • 正面向上
  • 点数超过4

这样的描述转为数字,从而方便纳入数学框架。因此,这就需要一个规则 ,把每个基本结果 ω∈Ω\omega \in \Omegaω∈Ω 映射成一个实数

例如:

  • 掷骰子:ω=3↦X(ω)=3\omega = 3 \mapsto X(\omega) = 3ω=3↦X(ω)=3
  • 抛硬币:ω=H↦X(ω)=1\omega = H \mapsto X(\omega) = 1ω=H↦X(ω)=1,ω=T↦X(ω)=0\omega = T \mapsto X(\omega) = 0ω=T↦X(ω)=0

这个映射 X:Ω→RX: \Omega \to \mathbb{R}X:Ω→R 就是随机变量

3.2 问题:不是所有映射都"合法"

我们希望对任意实数 xxx,都能计算概率 P(X≤x)\mathbb{P}(X \leq x)P(X≤x)。

这意味着集合 {ω∈Ω:X(ω)≤x}\{\omega \in \Omega : X(\omega) \leq x\}{ω∈Ω:X(ω)≤x} 必须是一个"合法事件" ,即属于 F\mathcal{F}F。

❗ 如果 XXX 任意定义,这个集合可能不在 F\mathcal{F}F 中,导致概率无定义!因此必须对XXX施加一定的约束,即可测性!!

3.3 解决方案:可测性(Measurability)

定义 :设 (Ω,F)(\Omega, \mathcal{F})(Ω,F) 和 (R,B(R))(\mathbb{R}, \mathcal{B}(\mathbb{R}))(R,B(R)) 是两个可测空间。

函数 X:Ω→RX: \Omega \to \mathbb{R}X:Ω→R 称为 F\mathcal{F}F-可测函数 (即随机变量 ),如果对任意 Borel 集 B∈B(R)B \in \mathcal{B}(\mathbb{R})B∈B(R),都有:
X−1(B)={ω∈Ω:X(ω)∈B}∈F X^{-1}(B) = \{\omega \in \Omega : X(\omega) \in B\} \in \mathcal{F} X−1(B)={ω∈Ω:X(ω)∈B}∈F
等价地(常用简化条件):对任意 x∈Rx \in \mathbb{R}x∈R,
{ω:X(ω)≤x}∈F \{\omega : X(\omega) \leq x\} \in \mathcal{F} {ω:X(ω)≤x}∈F
✅ 这保证了 P(X≤x)=P({ω:X(ω)≤x})\mathbb{P}(X \leq x) = P(\{\omega : X(\omega) \leq x\})P(X≤x)=P({ω:X(ω)≤x}) 总是有定义的!

3.4 通俗解释"可测"

  • "可测" = "结果可以被观测并赋予概率"
  • 随机变量 XXX 必须"尊重"我们预先定义好的事件结构 F\mathcal{F}F
  • 在离散空间(如骰子),几乎所有函数都可测;
  • 在连续空间(如实数),可测性排除了"病态"函数(如基于选择公理构造的不可测集)

四、完整数学表述

4.1 概率空间(Probability Space)

一个概率空间是一个三元组 (Ω,F,P)(\Omega, \mathcal{F}, P)(Ω,F,P),满足:

  • Ω\OmegaΩ 是非空集合(样本空间);
  • F⊆2Ω\mathcal{F} \subseteq 2^\OmegaF⊆2Ω 是 σ\sigmaσ-代数(事件域);
  • P:F→[0,1]P: \mathcal{F} \to [0,1]P:F→[0,1] 是概率测度,满足:
    • P(Ω)=1P(\Omega) = 1P(Ω)=1;
    • 对任意互不相交的 A1,A2,⋯∈FA_1, A_2, \dots \in \mathcal{F}A1,A2,⋯∈F,有
      P(⋃n=1∞An)=∑n=1∞P(An) P\left( \bigcup_{n=1}^\infty A_n \right) = \sum_{n=1}^\infty P(A_n) P(n=1⋃∞An)=n=1∑∞P(An)

4.2 随机变量(Random Variable)

设 (Ω,F,P)(\Omega, \mathcal{F}, P)(Ω,F,P) 是概率空间。

一个函数 X:Ω→RX: \Omega \to \mathbb{R}X:Ω→R 称为实值随机变量 ,如果它是 (F,B(R))(\mathcal{F}, \mathcal{B}(\mathbb{R}))(F,B(R))-可测的 ,即:
∀B∈B(R),X−1(B)∈F \forall B \in \mathcal{B}(\mathbb{R}), \quad X^{-1}(B) \in \mathcal{F} ∀B∈B(R),X−1(B)∈F

其中 B(R)\mathcal{B}(\mathbb{R})B(R) 是 R\mathbb{R}R 上的 Borel σ\sigmaσ-代数(由所有开区间生成)。

由此可定义分布函数
FX(x)=P(X≤x)=P({ω:X(ω)≤x}) F_X(x) = \mathbb{P}(X \leq x) = P(\{\omega : X(\omega) \leq x\}) FX(x)=P(X≤x)=P({ω:X(ω)≤x})


五、总结

概念 工程/科学中的对应
Ω\OmegaΩ 所有可能的系统状态(如所有可能的噪声波形)
F\mathcal{F}F 传感器能观测到的事件集合(受限于分辨率和带宽)
PPP 物理规律或经验统计给出的概率模型(如高斯噪声)
随机变量 XXX 传感器输出、股价、温度读数等可观测的数值量
可测性 保证"读数落在某区间"的概率有定义,避免逻辑矛盾

随机变量的本质含义

"所谓的随机变量,其实并没有直接受随机性,它仅仅是一个映射,将基本事件映射为一个实数。而真正接受随机性的是基本事件。"

"随机变量没有直接接受受随机性",是因为:

它本身是一个确定的函数;

它的"随机性"来源于其输入(基本事件)的不确定性;

它的作用是将抽象的随机事件转化为具体的数值,以便我们进行计算和分析。

✅ 所以,随机性的源头是基本事件 ωωω,而随机变量 XXX是连接"现实世界"与"数学世界"的桥梁。
这正是现代概率论的伟大之处:它把"不可观测的随机性"通过"可测的映射"转化为可以计算的数学对象。

随机变量是可测函数的含义

本章总结

概率空间 (Ω,F,P)(\Omega, \mathcal{F}, P)(Ω,F,P) 提供了严谨的概率建模范式

随机变量作为可测函数 ,架起了抽象样本空间与具体数值观测之间的桥梁;
可测性是保证概率运算合法性的"守门人",是现代概率论区别于朴素概率思想的关键。

没有这套框架,我们就无法严格处理连续随机变量、条件期望、随机过程等高级概念------它不仅是数学装饰,更是工程建模的逻辑基础

相关推荐
长空任鸟飞_阿康3 小时前
在 Vue 3.5 中优雅地集成 wangEditor,并定制“AI 工具”下拉菜单(总结/润色/翻译)
前端·vue.js·人工智能
滑水滑成滑头3 小时前
**发散创新:多智能体系统的探索与实践**随着人工智能技术的飞速发展,多智能体系统作为当今研究的热点领域,正受到越来越多关注
java·网络·人工智能·python
云布道师3 小时前
阿里云 OSS MetaQuery 全面升级——新增内容和语义的检索能力,助力 AI 应用快速落地
人工智能·阿里云·云计算
m0_650108243 小时前
【论文精读】FlowVid:驯服不完美的光流,实现一致的视频到视频合成
人工智能·计算机视觉·扩散模型·视频编辑·视频生成·论文精读·不完美光流
radient3 小时前
属于Agent的课本 - RAG
人工智能·后端·程序员
第七序章3 小时前
【C + +】红黑树:全面剖析与深度学习
c语言·开发语言·数据结构·c++·人工智能
渡我白衣3 小时前
未来的 AI 操作系统(三)——智能的中枢:从模型到系统的统一
人工智能·深度学习·ui·语言模型·人机交互
Blossom.1184 小时前
把 AI“缝”进布里:生成式编织神经网络让布料自带摄像头
人工智能·python·单片机·深度学习·神经网络·目标检测·机器学习