《小白学随机过程》第一章：随机过程——定义和形式 (附录1 探究随机变量)

深入理解概率空间与随机变量：从直观到数学

一、通俗理解：用"抛硬币"讲清楚基本概念

1.1 基本事件（Elementary Outcome）

想象你抛一枚硬币一次。可能出现的结果只有两种：

正面（记为 H）
反面（记为 T）

每一个不可再分的、确定的结果 ，就叫一个基本事件（或样本点）。

✅ 在这个例子中，基本事件有两个：H 和 T。

1.2 样本空间（Sample Space）Ω\OmegaΩ

所有可能的基本事件组成的集合，称为样本空间 ，记作 Ω\OmegaΩ。

抛一次硬币：Ω={H,T}\Omega = \{H, T\}Ω={H,T}
掷一个骰子：Ω={1,2,3,4,5,6}\Omega = \{1, 2, 3, 4, 5, 6\}Ω={1,2,3,4,5,6}
测量明天的气温（连续）：Ω=R\Omega = \mathbb{R}Ω=R（或某个区间，如 [−50,50][-50, 50][−50,50]）

🌟 样本空间 = 所有可能结果组成的集合。

1.3 事件（Event）和事件域（σ\sigmaσ-代数）F\mathcal{F}F

现实中我们关心的往往不是单个结果，而是一类结果的集合，这个集合叫做事件或事件集合。

"出现偶数点" → 事件 A={2,4,6}A = \{2, 4, 6\}A={2,4,6}
"硬币不是反面" → 事件 B={H}B = \{H\}B={H}
"气温高于 30°C" → 事件 C=(30,∞)C = (30, \infty)C=(30,∞)

⚠️ 注意：事件是样本空间的子集。

但并不是样本空间所有子集都能被赋予"概率"（尤其在连续情形下） (这句话的详细解读以及反例证明，涉及到较多测度论的内容，在此不再展开，只需要记住这个结论即可)，这就引出了事件域 的概念。(通过后面的解读我们知道，事件域就是能被赋予"概率"的事件的集合)

为了能一致地定义概率 ，我们需要一个满足特定规则的事件集合 族 F\mathcal{F}F，称为 σ\sigmaσ-代数（读作"西格玛代数"）。

它必须满足三条规则：

包含全集 ：Ω∈F\Omega \in \mathcal{F}Ω∈F
对补集封闭 ：若 A∈FA \in \mathcal{F}A∈F，则 Ac=Ω∖A∈FA^c = \Omega \setminus A \in \mathcal{F}Ac=Ω∖A∈F
对可数并封闭 ：若 A1,A2,⋯∈FA_1, A_2, \dots \in \mathcal{F}A1,A2,⋯∈F，则 ⋃n=1∞An∈F\bigcup_{n=1}^\infty A_n \in \mathcal{F}⋃n=1∞An∈F

💡 直观理解：F\mathcal{F}F 是我们"允许谈论概率"的所有事件的集合。

离散情形（如骰子）：F\mathcal{F}F 通常是 Ω\OmegaΩ 的所有子集（幂集）。

连续情形（如实数）：F\mathcal{F}F 通常是 Borel σ\sigmaσ-代数 （由所有开区间生成的最小 σ\sigmaσ-代数），记作 B(R)\mathcal{B}(\mathbb{R})B(R)。

1.5 概率测度（Probability Measure）PPP

概率测度 PPP 是一个函数，它给每个 A∈FA \in \mathcal{F}A∈F 赋予一个 [0,1][0,1][0,1] 之间的数，表示该事件发生的"可能性大小"。

它必须满足：

非负性 ：P(A)≥0P(A) \geq 0P(A)≥0
规范性 ：P(Ω)=1P(\Omega) = 1P(Ω)=1
可数可加性 （σ\sigmaσ-可加性）：若 A1,A2,...A_1, A_2, \dotsA1,A2,... 互不相交，则
P(⋃n=1∞An)=∑n=1∞P(An) P\left( \bigcup_{n=1}^\infty A_n \right) = \sum_{n=1}^\infty P(A_n) P(n=1⋃∞An)=n=1∑∞P(An)

✅ 例子（公平骰子）：

P({1})=16P(\{1\}) = \frac{1}{6}P({1})=61

P(偶数)=P({2,4,6})=36=12P(\text{偶数}) = P(\{2,4,6\}) = \frac{3}{6} = \frac{1}{2}P(偶数)=P({2,4,6})=63=21
✅ 例子（非公平骰子）：

P({1})=P({3})=P({5})=112P(\{1\}) = P(\{3\}) = P(\{5\}) = \frac{1}{12}P({1})=P({3})=P({5})=121

P(偶数)=P({2,4,6})=912=34P(\text{偶数}) = P(\{2,4,6\}) = \frac{9}{12} = \frac{3}{4}P(偶数)=P({2,4,6})=129=43
PPP 是一个事件到[0,1][0, 1][0,1] 之间的映射！

二、概率空间：三位一体的数学框架

将上述三者组合起来，就构成了概率空间（Probability Space）：

概率空间是一个三元组 (Ω,F,P)(\Omega, \mathcal{F}, P)(Ω,F,P)，其中：

Ω\OmegaΩ：样本空间（所有可能结果）

F\mathcal{F}F：σ\sigmaσ-代数（所有可测事件）

PPP：概率测度（给事件赋概率）

这个框架由苏联数学家柯尔莫哥洛夫（Kolmogorov） 于1933年公理化建立，是现代概率论的基石。

🌰 实际应用举例：

金融风控 ：Ω\OmegaΩ = 所有可能的市场路径；F\mathcal{F}F = 可观测的市场信息集合；PPP = 风险中性测度。

机器学习 ：数据点 (x,y)(x, y)(x,y) 被视为从某个未知概率空间中独立采样。

通信系统 ：噪声建模为定义在 (R,B(R),P)(\mathbb{R}, \mathcal{B}(\mathbb{R}), P)(R,B(R),P) 上的随机变量。

三、为什么说随机变量是一个可测函数？------引入随机变量

3.1 动机：从"事件"到"数值"

在实际问题中，比如掷骰子或者抛硬币，我们希望把诸如

正面向上
点数超过4

这样的描述转为数字，从而方便纳入数学框架。因此，这就需要一个规则，把每个基本结果 ω∈Ω\omega \in \Omegaω∈Ω 映射成一个实数。

例如：

掷骰子：ω=3↦X(ω)=3\omega = 3 \mapsto X(\omega) = 3ω=3↦X(ω)=3
抛硬币：ω=H↦X(ω)=1\omega = H \mapsto X(\omega) = 1ω=H↦X(ω)=1，ω=T↦X(ω)=0\omega = T \mapsto X(\omega) = 0ω=T↦X(ω)=0

这个映射 X:Ω→RX: \Omega \to \mathbb{R}X:Ω→R 就是随机变量。

3.2 问题：不是所有映射都"合法"

我们希望对任意实数 xxx，都能计算概率 P(X≤x)\mathbb{P}(X \leq x)P(X≤x)。

这意味着集合 {ω∈Ω:X(ω)≤x}\{\omega \in \Omega : X(\omega) \leq x\}{ω∈Ω:X(ω)≤x} 必须是一个"合法事件" ，即属于 F\mathcal{F}F。

❗ 如果 XXX 任意定义，这个集合可能不在 F\mathcal{F}F 中，导致概率无定义！因此必须对XXX施加一定的约束，即可测性！！

3.3 解决方案：可测性（Measurability）

定义：设 (Ω,F)(\Omega, \mathcal{F})(Ω,F) 和 (R,B(R))(\mathbb{R}, \mathcal{B}(\mathbb{R}))(R,B(R)) 是两个可测空间。

函数 X:Ω→RX: \Omega \to \mathbb{R}X:Ω→R 称为 F\mathcal{F}F-可测函数 （即随机变量 ），如果对任意 Borel 集 B∈B(R)B \in \mathcal{B}(\mathbb{R})B∈B(R)，都有：
X−1(B)={ω∈Ω:X(ω)∈B}∈F X^{-1}(B) = \{\omega \in \Omega : X(\omega) \in B\} \in \mathcal{F} X−1(B)={ω∈Ω:X(ω)∈B}∈F
等价地（常用简化条件）：对任意 x∈Rx \in \mathbb{R}x∈R，
{ω:X(ω)≤x}∈F \{\omega : X(\omega) \leq x\} \in \mathcal{F} {ω:X(ω)≤x}∈F
✅ 这保证了 P(X≤x)=P({ω:X(ω)≤x})\mathbb{P}(X \leq x) = P(\{\omega : X(\omega) \leq x\})P(X≤x)=P({ω:X(ω)≤x}) 总是有定义的！

3.4 通俗解释"可测"

"可测" = "结果可以被观测并赋予概率"
随机变量 XXX 必须"尊重"我们预先定义好的事件结构 F\mathcal{F}F
在离散空间（如骰子），几乎所有函数都可测；
在连续空间（如实数），可测性排除了"病态"函数（如基于选择公理构造的不可测集）

四、完整数学表述

4.1 概率空间（Probability Space）

一个概率空间是一个三元组 (Ω,F,P)(\Omega, \mathcal{F}, P)(Ω,F,P)，满足：

Ω\OmegaΩ 是非空集合（样本空间）；
F⊆2Ω\mathcal{F} \subseteq 2^\OmegaF⊆2Ω 是 σ\sigmaσ-代数（事件域）；
P:F→[0,1]P: \mathcal{F} \to [0,1]P:F→[0,1] 是概率测度，满足：
- P(Ω)=1P(\Omega) = 1P(Ω)=1；
- 对任意互不相交的 A1,A2,⋯∈FA_1, A_2, \dots \in \mathcal{F}A1,A2,⋯∈F，有
  P(⋃n=1∞An)=∑n=1∞P(An) P\left( \bigcup_{n=1}^\infty A_n \right) = \sum_{n=1}^\infty P(A_n) P(n=1⋃∞An)=n=1∑∞P(An)

4.2 随机变量（Random Variable）

设 (Ω,F,P)(\Omega, \mathcal{F}, P)(Ω,F,P) 是概率空间。

一个函数 X:Ω→RX: \Omega \to \mathbb{R}X:Ω→R 称为实值随机变量 ，如果它是 (F,B(R))(\mathcal{F}, \mathcal{B}(\mathbb{R}))(F,B(R))-可测的 ，即：
∀B∈B(R),X−1(B)∈F \forall B \in \mathcal{B}(\mathbb{R}), \quad X^{-1}(B) \in \mathcal{F} ∀B∈B(R),X−1(B)∈F

其中 B(R)\mathcal{B}(\mathbb{R})B(R) 是 R\mathbb{R}R 上的 Borel σ\sigmaσ-代数（由所有开区间生成）。

由此可定义分布函数 ：
FX(x)=P(X≤x)=P({ω:X(ω)≤x}) F_X(x) = \mathbb{P}(X \leq x) = P(\{\omega : X(\omega) \leq x\}) FX(x)=P(X≤x)=P({ω:X(ω)≤x})

五、总结

概念	工程/科学中的对应
Ω\OmegaΩ	所有可能的系统状态（如所有可能的噪声波形）
F\mathcal{F}F	传感器能观测到的事件集合（受限于分辨率和带宽）
PPP	物理规律或经验统计给出的概率模型（如高斯噪声）
随机变量 XXX	传感器输出、股价、温度读数等可观测的数值量
可测性	保证"读数落在某区间"的概率有定义，避免逻辑矛盾

随机变量的本质含义

"所谓的随机变量，其实并没有直接受随机性，它仅仅是一个映射，将基本事件映射为一个实数。而真正接受随机性的是基本事件。"

"随机变量没有直接接受受随机性"，是因为：

它本身是一个确定的函数；

它的"随机性"来源于其输入（基本事件）的不确定性；

它的作用是将抽象的随机事件转化为具体的数值，以便我们进行计算和分析。

✅ 所以，随机性的源头是基本事件 ωωω，而随机变量 XXX是连接"现实世界"与"数学世界"的桥梁。
这正是现代概率论的伟大之处：它把"不可观测的随机性"通过"可测的映射"转化为可以计算的数学对象。

随机变量是可测函数的含义

本章总结

概率空间 (Ω,F,P)(\Omega, \mathcal{F}, P)(Ω,F,P) 提供了严谨的概率建模范式 ；

随机变量作为可测函数 ，架起了抽象样本空间与具体数值观测之间的桥梁；
可测性是保证概率运算合法性的"守门人"，是现代概率论区别于朴素概率思想的关键。

没有这套框架，我们就无法严格处理连续随机变量、条件期望、随机过程等高级概念------它不仅是数学装饰，更是工程建模的逻辑基础。