正态分布概率密度函数的完整推导——基于杨辉三角极限与误差公理

正态分布概率密度函数的完整推导------基于杨辉三角极限与误差公理

摘要

正态分布是概率论与数理统计中最重要的连续型概率分布,其核心公式存在两大经典推导体系:一是离散极限推导,由杨辉三角对应的二项分布在试验次数趋于无穷时的包络曲线收敛得到,为棣莫弗-拉普拉斯中心极限定理的原始形态;二是连续误差推导,基于观测误差的对称性、独立性公理严格推演得出。本文整合两种经典方法,从离散计数规律到连续概率分布,完整、严谨推导标准正态分布与一般正态分布概率密度函数,揭示正态分布的底层数学本质:正态分布是大量独立微小随机事件叠加后的极限稳定分布。

关键词: 正态分布;杨辉三角;二项分布;斯特林公式;中心极限定理;误差分布


一、引言

正态分布又称高斯分布,广泛应用于自然科学、工程技术、社会统计等领域。多数教材仅直接给出正态分布公式,未解释其数学起源。

从历史与底层逻辑来看:

  1. 离散本源 :杨辉三角的每一行对应有限次伯努利试验的组合计数,归一化后为二项分布;当试验次数 n→∞n \to \inftyn→∞ 时,离散柱状分布的外包络光滑化,严格收敛为正态分布曲线。

  2. 连续本源:一切随机观测误差满足"对称、微小、独立叠加"三大公理,唯一满足该规律的连续概率分布即为正态分布。

本文结合两种推导路径,完成从离散到连续、从经验规律到严格公式的完整证明。


二、预备知识与基础定义

2.1 杨辉三角与二项分布

nnn 行(从 000 开始计数)的数值为组合数:

Cnk=n!k!(n−k)!,k=0,1,2,⋯ ,nC_{n}^{k}=\frac{n!}{k!(n-k)!},\quad k=0,1,2,\cdots,nCnk=k!(n−k)!n!,k=0,1,2,⋯,n

该行所有数值总和为:

∑k=0nCnk=2n\sum_{k=0}^{n} C_{n}^{k}=2^{n}∑k=0nCnk=2n

nnn 次独立均匀伯努利试验(抛均匀硬币,正反概率 p=q=12p=q=\frac{1}{2}p=q=21),XXX 服从二项分布 X∼B(n,12)X \sim B(n,\frac{1}{2})X∼B(n,21),概率公式为:

P(X=k)=Cnk2nP(X=k)=\frac{C_{n}^{k}}{2^{n}}P(X=k)=2nCnk

该式本质是杨辉三角数值的归一化概率。

2.2 核心辅助公式

  1. 斯特林阶乘近似公式 (n→∞n \to \inftyn→∞,大数渐近展开)

n!∼nne−n2πnn! \sim n^{n} e^{-n} \sqrt{2\pi n}n!∼nne−n2πn

  1. 对数泰勒展开 (小量 ε→0\varepsilon \to 0ε→0)

ln⁡(1+ε)≈ε−ε22\ln(1+\varepsilon) \approx \varepsilon - \frac{\varepsilon^{2}}{2}ln(1+ε)≈ε−2ε2

  1. 高斯积分公式

∫−∞+∞e−x2/2dx=2π\int_{-\infty}^{+\infty} e^{-x^{2}/2} dx = \sqrt{2\pi}∫−∞+∞e−x2/2dx=2π

2.3 二项分布数字特征

对任意二项分布 X∼B(n,p)X \sim B(n, p)X∼B(n,p):

  • 期望:μ=np\mu = npμ=np

  • 方差:σ2=np(1−p)\sigma^{2} = np(1-p)σ2=np(1−p)

  • 标准化变量:Z=X−μσZ = \frac{X-\mu}{\sigma}Z=σX−μ


三、第一种推导:杨辉三角无穷极限(离散→连续)

3.1 组合数代入斯特林公式

将斯特林公式代入二项分布组合数:

Cnk=n!k!(n−k)!∼nne−n2πnkke−k2πk⋅(n−k)n−ke−(n−k)2π(n−k)C_{n}^{k} = \frac{n!}{k!(n-k)!} \sim \frac{n^{n} e^{-n} \sqrt{2\pi n}}{k^{k} e^{-k} \sqrt{2\pi k} \cdot (n-k)^{n-k} e^{-(n-k)} \sqrt{2\pi(n-k)}}Cnk=k!(n−k)!n!∼kke−k2πk ⋅(n−k)n−ke−(n−k)2π(n−k) nne−n2πn

化简得渐近式:

Cnk∼nn2π⋅kk+12⋅(n−k)n−k+12C_{n}^{k} \sim \frac{n^{n}}{\sqrt{2\pi} \cdot k^{k+\frac{1}{2}} \cdot (n-k)^{n-k+\frac{1}{2}}}Cnk∼2π ⋅kk+21⋅(n−k)n−k+21nn

代入二项概率通式 P(X=k)=Cnkpkqn−kP(X=k) = C_{n}^{k} p^{k} q^{n-k}P(X=k)=Cnkpkqn−k。

3.2 对数线性化与泰勒展开

为简化指数运算,对概率取自然对数:

ln⁡P(X=k)=ln⁡Cnk+kln⁡p+(n−k)ln⁡q\ln P(X=k) = \ln C_{n}^{k} + k\ln p + (n-k)\ln qlnP(X=k)=lnCnk+klnp+(n−k)lnq

引入均值偏移变量,令:

k=np+xnpqk = np + x\sqrt{npq}k=np+xnpq

n−k=nq−xnpqn-k = nq - x\sqrt{npq}n−k=nq−xnpq

当 n→∞n \to \inftyn→∞ 时,xxx 为有限定值,代表标准化后的偏差。

将 kkk、n−kn-kn−k 改写为均值的微小偏移形式,代入对数项并做泰勒二阶展开:

  1. 所有一次线性项完全抵消(对称性导致正负偏差抵消);

  2. 仅保留二阶主导项,最终化简得:

ln⁡P(X=k)≈−x22−12ln⁡(2πnpq)\ln P(X=k) \approx -\frac{x^{2}}{2} - \frac{1}{2}\ln(2\pi npq)lnP(X=k)≈−2x2−21ln(2πnpq)

3.3 极限收敛为连续密度

对对数式还原指数:

P(X=k)≈12πnpqe−x22P(X=k) \approx \frac{1}{\sqrt{2\pi npq}} e^{-\frac{x^{2}}{2}}P(X=k)≈2πnpq 1e−2x2

其中标准化变量 x=k−npnpq=k−μσx = \frac{k-np}{\sqrt{npq}} = \frac{k-\mu}{\sigma}x=npq k−np=σk−μ。

当 n→∞n \to \inftyn→∞,离散取值间隔 Δk=1\Delta k = 1Δk=1 趋于无穷小,离散概率 P(X=k)P(X=k)P(X=k) 转化为连续概率微元:

f(x)dx=P(X=k)f(x)dx = P(X=k)f(x)dx=P(X=k)

至此,由杨辉三角无穷极限推导出一般正态分布密度函数。


四、第二种推导:高斯误差公理推导(连续本源)

4.1 误差分布三大公理

设随机观测误差为 xxx,概率密度函数为 f(x)f(x)f(x),满足物理观测基本规律:

  1. 对称性 :正负误差概率相等,f(x)=f(−x)f(x) = f(-x)f(x)=f(−x)

  2. 单峰性 :误差为 000 时概率最大,偏差越大概率越小

  3. 独立性:多个独立观测误差的联合概率为各误差概率的乘积

4.2 微分方程建模

基于上述公理可证明,满足乘积可分性与对称性的连续可导函数,必满足微分关系:

f′(x)xf(x)=k\frac{f'(x)}{x f(x)} = kxf(x)f′(x)=k

对等式两边积分:

ln⁡f(x)=k2x2+c\ln f(x) = \frac{k}{2}x^{2} + clnf(x)=2kx2+c

还原指数形式:

f(x)=Aek2x2f(x) = A e^{\frac{k}{2}x^{2}}f(x)=Ae2kx2

其中 A=ecA = e^{c}A=ec 为归一化常数,k<0k < 0k<0 保证分布收敛。

4.3 归一化定参(确定常数)

根据概率密度归一化条件:

∫−∞+∞f(x)dx=1\int_{-\infty}^{+\infty} f(x) dx = 1∫−∞+∞f(x)dx=1

代入高斯积分公式:

A∫−∞+∞ek2x2dx=A⋅2π−k=1A \int_{-\infty}^{+\infty} e^{\frac{k}{2}x^{2}} dx = A \cdot \sqrt{\frac{2\pi}{-k}} = 1A∫−∞+∞e2kx2dx=A⋅−k2π =1

结合方差定义标准化参数,令 k=−1σ2k = -\frac{1}{\sigma^{2}}k=−σ21,解得:

A=12πσA = \frac{1}{\sqrt{2\pi}\sigma}A=2π σ1

最终得到与离散极限法完全一致的一般正态分布公式。


五、标准正态分布最终形式

5.1 一般正态分布

X∼N(μ,σ2)X \sim N(\mu, \sigma^{2})X∼N(μ,σ2),概率密度函数:

f(x)=12πσe−(x−μ)22σ2,x∈Rf(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}},\quad x \in \mathbb{R}f(x)=2π σ1e−2σ2(x−μ)2,x∈R

5.2 标准正态分布

令 μ=0\mu = 0μ=0,σ=1\sigma = 1σ=1,得到标准正态分布 N(0,1)N(0,1)N(0,1):

φ(x)=12πe−x22,x∈R\varphi(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^{2}}{2}},\quad x \in \mathbb{R}φ(x)=2π 1e−2x2,x∈R


六、结论与本质总结

  1. 离散本质:正态分布是杨辉三角(二项计数)无穷迭代的极限包络曲线,所有大量独立二元随机试验,最终都会收敛为正态分布

  2. 连续本质:正态分布是唯一满足对称、独立、微小误差叠加的连续概率分布

  3. 定理意义:本文推导严格证明了棣莫弗-拉普拉斯中心极限定理的核心结论,解释了正态分布在自然界普遍存在的数学根源------一切由大量独立微小随机因素叠加的变量,均服从正态分布


参考文献

1 盛骤, 谢式千. 概率论与数理统计M. 高等教育出版社.

2 陈希孺. 概率论与数理统计基础M. 科学出版社.

3 Sarty G E. The Normal Distribution as a Limit of Binomial Distributions J. LibreTexts Statistics, 2024.

4 Veillette M. Gaussian Distribution Mathematical Derivation R. 2025.

作者: 乖乖数学

创作时间: 2026年6月28日