概率论直觉(一):大数定律

想象一下抛掷 n 枚硬币。正面朝上的比例会是一个随机值,可能是 0.48,也可能是 0.53,它会变化。但大数定律是这么说的:

当 n 趋近于无穷大时,正面朝上的比例会收敛到真实概率 (0.5)。不仅仅是"接近",它以概率 1 收敛。随机性并没有消失,但它对平均值的影响会减小。

这样想:抛掷 10 枚硬币,出现 7 次正面朝上(70%)并不奇怪。但用一百万枚硬币,得到70万枚正面朝上(70%)的概率微乎其微。样本越多,实际比例就越集中在预期值附近。

所以,这种"确定性"出现在极限情况下,并非对任何单个结果的确定性,而是对整体行为的确定性。即使每个个体事件仍然是随机的,平均值也会趋于稳定。


大数定律不仅仅是对我们观察到的现象的描述,它是一个可以被证明的数学定理。我们不需要真的抛掷无数枚硬币来验证它的正确性,就像我们不需要测量每一个三角形来验证勾股定理一样。

证明过程运用了概率和极限的正式定义。我们首先做出一些假设,比如每次抛硬币都是独立的,概率为1/2。然后运用数学推理来证明:当n趋于无穷大时,平均值必然收敛于期望值。

关键工具包括切比雪夫不等式,或者更复杂的方法。它们表明,平均值与真实值偏差任意固定值的概率随着 n 的增大而趋近于零。

我们永远无法真正达到无穷大。但证明告诉我们,在无穷大的极限情况下会发生什么,更实际地说,它告诉我们,对于较大的有限值 n,收敛的速度有多快。


让我们先来看一下更直观的"弱大数定律"。

假设我们抛掷 n 枚硬币。每次抛掷的结果 Xi 都是随机的:正面为 1,反面为 0。每次正面朝上的概率都是 1/2。

平均值是:(X₁ + X₂ + ... + Xn)/n

我们想证明,随着 n 的增大,这个平均值会趋近于 1/2。

关键在于,我们可以用方差来衡量随机值的"分散程度"。抛一次硬币,方差是 1/4。

现在,当你对 n 个独立的随机变量取平均值时,该平均值的方差为:(一次抛硬币的方差)/n = 1/(4n)

这一点至关重要,随着 n 增大,方差会减小。平均值的分布范围会缩小,更集中在 1/2 附近。然后我们使用切比雪夫不等式,它指出:偏离期望值的概率受方差的限制。

相关推荐
RainCity5 天前
Java Swing 自定义组件库分享(十二)
java·笔记·后端
LinXunFeng12 天前
Obsidian - 使用 Share Note 分享笔记并自部署
前端·笔记·github
闪闪发亮的小星星16 天前
高斯光以及高斯光公式解释
笔记
cqbzcsq16 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
阿米亚波16 天前
【Windows】QEMU 启动 openEuler aarch64/arm64 架构系统 + 离线软件源
linux·windows·经验分享·笔记·架构·arm
自传.16 天前
尚硅谷 Vibe Coding|第三章(1) Claude Code深度使用与进阶技巧 学习笔记
笔记·学习·尚硅谷·vibecoding
酉鬼女又兒16 天前
零基础入门计算机网络运输层:端到端通信核心作用、端口号分类规则、复用分用工作机制及UDP与TCP协议全方位对比详解
网络·网络协议·tcp/ip·计算机网络·考研·udp·php
.千余16 天前
【C++】模板进阶全解:非类型参数|全特化|偏特化|分离编译完全指南
开发语言·c++·笔记·学习·其他
自传.16 天前
尚硅谷 Vibe Coding|第二章 AI编程工具生态 学习笔记
笔记·学习·ai编程·尚硅谷·vibe coding
秋波。未央16 天前
Java Agent 开发 · Day 1 学习笔记(含作业完整标准答案)
java·笔记·学习