中心极限定理(Central Limit Theorem,CLT)是概率论中的一个重要定理,它说明了在某些条件下,独立随机变量的和(或平均值)趋向于正态分布的性质。具体来说,中心极限定理可以描述为:
定理表述:
设 ( X 1 , X 2 , ... , X n ) ( X_1, X_2, \dots, X_n ) (X1,X2,...,Xn) 是一组相互独立、服从相同分布的随机变量,其数学期望为 μ \mu μ,方差为 σ 2 \sigma^2 σ2(有限且不为零)。那么,当 n n n 足够大时,这组随机变量的标准化和:
Z n = ∑ i = 1 n X i − n μ n σ Z_n = \frac{\sum_{i=1}^n X_i - n\mu}{\sqrt{n}\sigma} Zn=n σ∑i=1nXi−nμ
的分布将近似服从标准正态分布,即:
Z n ⟶ d N ( 0 , 1 ) Z_n \overset{d}{\longrightarrow} N(0, 1) Zn⟶dN(0,1)
其中, N ( 0 , 1 ) N(0, 1) N(0,1)表示期望为 0、方差为 1 的标准正态分布, ⟶ d \overset{d}{\longrightarrow} ⟶d表示按分布收敛。
重要性:
-
应用广泛:中心极限定理为统计推断提供了理论基础,特别是在样本量足够大时,它允许我们使用正态分布来近似计算各种分布的抽样分布。
-
无需知道原始分布:即使我们不知道个体随机变量的具体分布,只要满足一定条件,我们仍然可以使用正态分布进行近似计算。
-
实际应用:在许多实际问题中,数据往往来自不同的分布,但只要样本量足够大,其样本均值往往接近于正态分布,这使得中心极限定理在实际应用中非常有用。
举例说明:
假设你在投掷硬币,如果你重复投掷多次,并记录正面朝上的次数,这些结果的均值会随着投掷次数的增加趋向于正态分布。这就是中心极限定理的一个直观应用。
中心极限定理在统计学、经济学、物理学等领域有着广泛的应用,是理解和分析数据分布的重要工具。