统计学(第8版)——统计学基础统计抽样与抽样分布(考试用)

一、抽样基本概念(符号要点)

(一)核心参数与统计量符号对比

类型 概念 符号 说明
参数 总体均值 μ \mu μ 唯一确定的总体特征值,通常未知
参数 总体方差 σ 2 \sigma^2 σ2 反映总体数据离散程度
参数 总体标准差 σ \sigma σ σ = σ 2 \sigma = \sqrt{\sigma^2} σ=σ2
统计量 样本均值 x ˉ = 1 n ∑ i = 1 n x i \bar{x} = \frac{1}{n}\sum_{i=1}^{n}x_i xˉ=n1∑i=1nxi 样本数据的算术平均,随机变量
统计量 样本方差 s 2 = 1 n − 1 ∑ i = 1 n ( x i − x ˉ ) 2 s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2 s2=n−11∑i=1n(xi−xˉ)2 无偏估计总体方差,随机变量
统计量 样本标准差 s = s 2 s = \sqrt{s^2} s=s2 与样本方差对应,量纲一致

二、重要概率分布(符号完整定义)

(一)正态分布( N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2))

1. 概率密度函数

f ( x ) = 1 σ 2 π e − ( x − μ ) 2 2 σ 2 ( − ∞ < x < + ∞ ) f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}} \quad (-\infty < x < +\infty) f(x)=σ2π 1e−2σ2(x−μ)2(−∞<x<+∞)

  • 符号说明

    • μ \mu μ:均值,决定分布中心位置

    • σ \sigma σ:标准差( σ > 0 \sigma > 0 σ>0),决定分布离散程度

2. 标准化转换公式

若 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2),令标准化变量

Z = X − μ σ ∼ N ( 0 , 1 ) Z = \frac{X - \mu}{\sigma} \sim N(0, 1) Z=σX−μ∼N(0,1)

例题 :设 X ∼ N ( 1 , 4 ) X \sim N(1, 4) X∼N(1,4),求 P ( 0 < X ≤ 10 ) P(0 < X \leq 10) P(0<X≤10)

  1. 标准化: Z 1 = 0 − 1 2 = − 0.5 Z_1 = \frac{0-1}{2} = -0.5 Z1=20−1=−0.5, Z 2 = 10 − 1 2 = 4.5 Z_2 = \frac{10-1}{2} = 4.5 Z2=210−1=4.5

  2. 查标准正态表: Φ ( 4.5 ) ≈ 1 \Phi(4.5) \approx 1 Φ(4.5)≈1, Φ ( − 0.5 ) = 1 − Φ ( 0.5 ) = 1 − 0.6915 = 0.3085 \Phi(-0.5) = 1 - \Phi(0.5) = 1 - 0.6915 = 0.3085 Φ(−0.5)=1−Φ(0.5)=1−0.6915=0.3085

  3. 概率: P ( 0 < X ≤ 10 ) = Φ ( 4.5 ) − Φ ( − 0.5 ) ≈ 1 − 0.3085 = 0.6915 P(0 < X \leq 10) = \Phi(4.5) - \Phi(-0.5) \approx 1 - 0.3085 = 0.6915 P(0<X≤10)=Φ(4.5)−Φ(−0.5)≈1−0.3085=0.6915

(二)卡方分布( χ 2 \chi^2 χ2分布)

1. 定义式

若 X 1 , X 2 , ... , X n ∼ N ( 0 , 1 ) X_1, X_2, \dots, X_n \sim N(0, 1) X1,X2,...,Xn∼N(0,1)且独立,则:

χ 2 = ∑ i = 1 n X i 2 ∼ χ 2 ( n ) \chi^2 = \sum_{i=1}^{n}X_i^2 \sim \chi^2(n) χ2=∑i=1nXi2∼χ2(n)

  • 符号说明

    • χ 2 \chi^2 χ2:卡方统计量,希腊字母 χ \chi χ(读作 "卡")

    • n n n:自由度,决定分布形态(右偏)

2. 单正态总体应用

若 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2),样本容量为 n n n,样本方差为 s 2 s^2 s2,则:

( n − 1 ) s 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1) σ2(n−1)s2∼χ2(n−1)

(三)F 分布( F ( n 1 , n 2 ) F(n_1, n_2) F(n1,n2))

1. 定义式

若 V ∼ χ 2 ( n 1 ) V \sim \chi^2(n_1) V∼χ2(n1), W ∼ χ 2 ( n 2 ) W \sim \chi^2(n_2) W∼χ2(n2)且独立,则:

F = V / n 1 W / n 2 ∼ F ( n 1 , n 2 ) F = \frac{V/n_1}{W/n_2} \sim F(n_1, n_2) F=W/n2V/n1∼F(n1,n2)

  • 符号说明

    • n 1 n_1 n1:第一自由度(分子自由度)

    • n 2 n_2 n2:第二自由度(分母自由度)

2. 双正态总体应用

设两组独立样本:

  • X 1 , ... , X n 1 ∼ N ( μ 1 , σ 1 2 ) X_1, \dots, X_{n_1} \sim N(\mu_1, \sigma_1^2) X1,...,Xn1∼N(μ1,σ12),样本方差 s 1 2 s_1^2 s12

  • Y 1 , ... , Y n 2 ∼ N ( μ 2 , σ 2 2 ) Y_1, \dots, Y_{n_2} \sim N(\mu_2, \sigma_2^2) Y1,...,Yn2∼N(μ2,σ22),样本方差 s 2 2 s_2^2 s22

    若 σ 1 2 = σ 2 2 \sigma_1^2 = \sigma_2^2 σ12=σ22,则:

s 1 2 s 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) \frac{s_1^2}{s_2^2} \sim F(n_1-1, n_2-1) s22s12∼F(n1−1,n2−1)

(四)t 分布( t ( n ) t(n) t(n))

1. 定义式

若 U ∼ N ( 0 , 1 ) U \sim N(0, 1) U∼N(0,1), W ∼ χ 2 ( n ) W \sim \chi^2(n) W∼χ2(n)且独立,则:

t = U W / n ∼ t ( n ) t = \frac{U}{\sqrt{W/n}} \sim t(n) t=W/n U∼t(n)

  • 符号说明

    • t t t:t 统计量,又称 "学生 t 统计量"

    • n n n:自由度,当 n → ∞ n \to \infty n→∞时, t ( n ) → N ( 0 , 1 ) t(n) \to N(0, 1) t(n)→N(0,1)

2. 单正态总体应用

若 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2),样本容量为 n n n,则:

t = x ˉ − μ s / n ∼ t ( n − 1 ) t = \frac{\bar{x} - \mu}{s/\sqrt{n}} \sim t(n-1) t=s/n xˉ−μ∼t(n−1)

例题 :面包日销量 μ = 70 \mu = 70 μ=70,样本 n = 15 n=15 n=15, s 2 = 16 s^2=16 s2=16,求 x ˉ = 74 \bar{x}=74 xˉ=74的概率

  1. 计算 t t t值: t = 74 − 70 4 / 15 = 4 4 / 3.872 ≈ 3.873 t = \frac{74-70}{4/\sqrt{15}} = \frac{4}{4/3.872} \approx 3.873 t=4/15 74−70=4/3.8724≈3.873

  2. 查 t t t分布表(自由度 14 14 14): P ( t ≥ 3.873 ) P(t \geq 3.873) P(t≥3.873)介于 0.0005 ∼ 0.001 0.0005 \sim 0.001 0.0005∼0.001之间

三、样本均值的抽样分布(符号公式)

(一)无限总体

若总体 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2),样本均值 x ˉ \bar{x} xˉ满足:

  • 期望: E ( x ˉ ) = μ E(\bar{x}) = \mu E(xˉ)=μ

  • 方差: D ( x ˉ ) = σ 2 n D(\bar{x}) = \frac{\sigma^2}{n} D(xˉ)=nσ2,标准差 σ x ˉ = σ n \sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}} σxˉ=n σ(均值标准差

(二)有限总体(无放回抽样)

当 n / N > 0.1 n/N > 0.1 n/N>0.1( N N N为总体容量),需引入有限总体修正系数

D ( x ˉ ) = σ 2 n ⋅ N − n N − 1 D(\bar{x}) = \frac{\sigma^2}{n} \cdot \frac{N-n}{N-1} D(xˉ)=nσ2⋅N−1N−n

  • 符号说明 : N − n N − 1 \frac{N-n}{N-1} N−1N−n用于修正无放回抽样的样本独立性损失

四、大数定律与中心极限定理(符号表述)

(一)辛钦大数定律

若 X 1 , X 2 , ... , X n X_1, X_2, \dots, X_n X1,X2,...,Xn独立同分布, E ( X i ) = μ E(X_i) = \mu E(Xi)=μ,则:

x ˉ = 1 n ∑ i = 1 n X i → P μ ( n → ∞ ) \bar{x} = \frac{1}{n}\sum_{i=1}^{n}X_i \xrightarrow{P} \mu \quad (n \to \infty) xˉ=n1∑i=1nXiP μ(n→∞)

  • 符号说明 : → P \xrightarrow{P} P 表示依概率收敛

(二)林德伯格 - 莱维中心极限定理

若 X 1 , X 2 , ... , X n X_1, X_2, \dots, X_n X1,X2,...,Xn独立同分布, E ( X i ) = μ E(X_i) = \mu E(Xi)=μ, D ( X i ) = σ 2 D(X_i) = \sigma^2 D(Xi)=σ2,则当 n n n足够大时:

x ˉ ∼ N ( μ , σ 2 n ) 或 x ˉ − μ σ / n ∼ N ( 0 , 1 ) \bar{x} \sim N\left(\mu, \frac{\sigma^2}{n}\right) \quad \text{或} \quad \frac{\bar{x} - \mu}{\sigma/\sqrt{n}} \sim N(0, 1) xˉ∼N(μ,nσ2)或σ/n xˉ−μ∼N(0,1)

  • 应用条件 : n ≥ 30 n \geq 30 n≥30(大样本)

五、核心符号速查表

符号 含义 所属领域
μ \mu μ 总体均值 参数
σ \sigma σ 总体标准差 参数
x ˉ \bar{x} xˉ 样本均值 统计量
s s s 样本标准差 统计量
χ 2 \chi^2 χ2 卡方统计量 抽样分布
F F F F 统计量 抽样分布
t t t t 统计量 抽样分布
∑ \sum ∑ 求和符号(如 ∑ i = 1 n x i \sum_{i=1}^{n}x_i ∑i=1nxi表示样本观测值之和) 基础运算
Φ ( x ) \Phi(x) Φ(x) 标准正态分布的累积分布函数( P ( Z ≤ x ) P(Z \leq x) P(Z≤x)) 概率计算