3.3 P60 **两个正态总体均值差的置信区间(方差未知但相等)**的推导过程
一、前提条件回顾
已知:
- 总体 X∼N(μ1,σ12)X \sim N(\mu_1, \sigma_1^2)X∼N(μ1,σ12),总体 Y∼N(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2)Y∼N(μ2,σ22),且两总体相互独立;
- 方差未知,但假设 σ12=σ22=σ2\sigma_1^2 = \sigma_2^2 = \sigma^2σ12=σ22=σ2(方差齐性);
- X1,...,Xn1X_1,\dots,X_{n_1}X1,...,Xn1 是来自 XXX 的样本,样本均值 Xˉ\bar{X}Xˉ,样本方差 S12=1n1−1∑i=1n1(Xi−Xˉ)2S_1^2 = \frac{1}{n_1-1}\sum_{i=1}^{n_1}(X_i-\bar{X})^2S12=n1−11∑i=1n1(Xi−Xˉ)2;
- Y1,...,Yn2Y_1,\dots,Y_{n_2}Y1,...,Yn2 是来自 YYY 的样本,样本均值 Yˉ\bar{Y}Yˉ,样本方差 S22=1n2−1∑j=1n2(Yj−Yˉ)2S_2^2 = \frac{1}{n_2-1}\sum_{j=1}^{n_2}(Y_j-\bar{Y})^2S22=n2−11∑j=1n2(Yj−Yˉ)2;
- 我们要估计的是均值差 μ1−μ2\mu_1-\mu_2μ1−μ2,置信水平为 1−α1-\alpha1−α。
二、第一步:构造标准正态变量 UUU
因为两个总体独立且正态,所以样本均值差 Xˉ−Yˉ\bar{X}-\bar{Y}Xˉ−Yˉ 也服从正态分布:
Xˉ∼N(μ1,σ2n1),Yˉ∼N(μ2,σ2n2) \bar{X} \sim N\left(\mu_1, \frac{\sigma^2}{n_1}\right),\quad \bar{Y} \sim N\left(\mu_2, \frac{\sigma^2}{n_2}\right) Xˉ∼N(μ1,n1σ2),Yˉ∼N(μ2,n2σ2)
因此:
Xˉ−Yˉ∼N(μ1−μ2, σ2(1n1+1n2)) \bar{X} - \bar{Y} \sim N\left(\mu_1-\mu_2,\ \sigma^2\left(\frac{1}{n_1}+\frac{1}{n_2}\right)\right) Xˉ−Yˉ∼N(μ1−μ2, σ2(n11+n21))
对其标准化,得到:
U=(Xˉ−Yˉ)−(μ1−μ2)σ1n1+1n2∼N(0,1) U = \frac{(\bar{X}-\bar{Y}) - (\mu_1-\mu_2)}{\sigma\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim N(0,1) U=σn11+n21 (Xˉ−Yˉ)−(μ1−μ2)∼N(0,1)
这就是分析里的 UUU,但它含有未知的 σ\sigmaσ,不能直接作为枢轴量。
三、第二步:构造卡方变量 χ2\chi^2χ2
对于单个正态总体,我们知道:
(n1−1)S12σ2∼χ2(n1−1),(n2−1)S22σ2∼χ2(n2−1) \frac{(n_1-1)S_1^2}{\sigma^2} \sim \chi^2(n_1-1),\quad \frac{(n_2-1)S_2^2}{\sigma^2} \sim \chi^2(n_2-1) σ2(n1−1)S12∼χ2(n1−1),σ2(n2−1)S22∼χ2(n2−1)
且这两个统计量相互独立(因为两总体独立)。根据卡方分布的可加性:
χ2=(n1−1)S12σ2+(n2−1)S22σ2∼χ2(n1+n2−2) \chi^2 = \frac{(n_1-1)S_1^2}{\sigma^2} + \frac{(n_2-1)S_2^2}{\sigma^2} \sim \chi^2(n_1+n_2-2) χ2=σ2(n1−1)S12+σ2(n2−1)S22∼χ2(n1+n2−2)
这就是分析里的 χ2\chi^2χ2,自由度是两个自由度之和 (n1−1)+(n2−1)=n1+n2−2(n_1-1)+(n_2-1)=n_1+n_2-2(n1−1)+(n2−1)=n1+n2−2。
四、第三步:构造 ttt 分布枢轴量 TTT
ttt 分布的定义是:若 Z∼N(0,1)Z \sim N(0,1)Z∼N(0,1),W∼χ2(m)W \sim \chi^2(m)W∼χ2(m),且 ZZZ 与 WWW 独立,则
T=ZW/m∼t(m) T = \frac{Z}{\sqrt{W/m}} \sim t(m) T=W/m Z∼t(m)
我们把前面的 UUU 和 χ2\chi^2χ2 代入这个定义:
- Z=UZ = UZ=U(标准正态)
- W=χ2W = \chi^2W=χ2(卡方分布,自由度 m=n1+n2−2m=n_1+n_2-2m=n1+n2−2)
于是得到:
T=Uχ2/(n1+n2−2) T = \frac{U}{\sqrt{\chi^2/(n_1+n_2-2)}} T=χ2/(n1+n2−2) U
把 UUU 和 χ2\chi^2χ2 的表达式代入:
T=(Xˉ−Yˉ)−(μ1−μ2)σ1n1+1n21n1+n2−2((n1−1)S12σ2+(n2−1)S22σ2) T = \frac{\frac{(\bar{X}-\bar{Y}) - (\mu_1-\mu_2)}{\sigma\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}}{\sqrt{\frac{1}{n_1+n_2-2}\left( \frac{(n_1-1)S_1^2}{\sigma^2} + \frac{(n_2-1)S_2^2}{\sigma^2} \right)}} T=n1+n2−21(σ2(n1−1)S12+σ2(n2−1)S22) σn11+n21 (Xˉ−Yˉ)−(μ1−μ2)
接下来我们化简分母里的根号项:
1n1+n2−2⋅(n1−1)S12+(n2−1)S22σ2=1σ⋅(n1−1)S12+(n2−1)S22n1+n2−2⏟Sw \sqrt{\frac{1}{n_1+n_2-2} \cdot \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{\sigma^2}} = \frac{1}{\sigma} \cdot \underbrace{\sqrt{\frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2}}}_{S_w} n1+n2−21⋅σ2(n1−1)S12+(n2−1)S22 =σ1⋅Sw n1+n2−2(n1−1)S12+(n2−1)S22
这里的 SwS_wSw 就是题目里定义的合并样本标准差 :
Sw=(n1−1)S12+(n2−1)S22n1+n2−2 S_w = \sqrt{\frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2}} Sw=n1+n2−2(n1−1)S12+(n2−1)S22
把化简后的分母代回 TTT 的表达式,σ\sigmaσ 会被约掉:
T=(Xˉ−Yˉ)−(μ1−μ2)Sw1n1+1n2∼t(n1+n2−2) T = \frac{(\bar{X}-\bar{Y}) - (\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim t(n_1+n_2-2) T=Swn11+n21 (Xˉ−Yˉ)−(μ1−μ2)∼t(n1+n2−2)
这就是我们需要的枢轴量,它只含待估参数 μ1−μ2\mu_1-\mu_2μ1−μ2,且分布已知。
五、第四步:利用 ttt 分布分位数建立概率等式
根据 ttt 分布的双侧分位数定义,有:
P{−tα2(n1+n2−2)<T<tα2(n1+n2−2)}=1−α P\left\{ -t_{\frac{\alpha}{2}}(n_1+n_2-2) < T < t_{\frac{\alpha}{2}}(n_1+n_2-2) \right\} = 1-\alpha P{−t2α(n1+n2−2)<T<t2α(n1+n2−2)}=1−α
把 TTT 的表达式代入不等式:
P{−tα2(n1+n2−2)<(Xˉ−Yˉ)−(μ1−μ2)Sw1n1+1n2<tα2(n1+n2−2)}=1−α P\left\{ -t_{\frac{\alpha}{2}}(n_1+n_2-2) < \frac{(\bar{X}-\bar{Y}) - (\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} < t_{\frac{\alpha}{2}}(n_1+n_2-2) \right\} = 1-\alpha P⎩ ⎨ ⎧−t2α(n1+n2−2)<Swn11+n21 (Xˉ−Yˉ)−(μ1−μ2)<t2α(n1+n2−2)⎭ ⎬ ⎫=1−α
六、第五步:解不等式,得到 μ1−μ2\mu_1-\mu_2μ1−μ2 的置信区间
我们把不等式变形,把 μ1−μ2\mu_1-\mu_2μ1−μ2 单独放在中间:
-
给不等式两边同时乘以 Sw1n1+1n2S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}Swn11+n21 (正数,不等号方向不变):
−tα2⋅Sw1n1+1n2<(Xˉ−Yˉ)−(μ1−μ2)<tα2⋅Sw1n1+1n2 -t_{\frac{\alpha}{2}} \cdot S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}} < (\bar{X}-\bar{Y}) - (\mu_1-\mu_2) < t_{\frac{\alpha}{2}} \cdot S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}} −t2α⋅Swn11+n21 <(Xˉ−Yˉ)−(μ1−μ2)<t2α⋅Swn11+n21
-
把 (Xˉ−Yˉ)(\bar{X}-\bar{Y})(Xˉ−Yˉ) 移到不等式两边,不等号方向反转:
(Xˉ−Yˉ)−tα2⋅Sw1n1+1n2<μ1−μ2<(Xˉ−Yˉ)+tα2⋅Sw1n1+1n2 (\bar{X}-\bar{Y}) - t_{\frac{\alpha}{2}} \cdot S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}} < \mu_1-\mu_2 < (\bar{X}-\bar{Y}) + t_{\frac{\alpha}{2}} \cdot S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}} (Xˉ−Yˉ)−t2α⋅Swn11+n21 <μ1−μ2<(Xˉ−Yˉ)+t2α⋅Swn11+n21
这就得到了置信水平为 1−α1-\alpha1−α 的置信区间,写成题目里的形式就是:
((Xˉ−Yˉ)±Sw1n1+1n2tα2(n1+n2−2)) \boxed{ \left( (\bar{X}-\bar{Y}) \pm S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}} t_{\frac{\alpha}{2}}(n_1+n_2-2) \right) } ((Xˉ−Yˉ)±Swn11+n21 t2α(n1+n2−2))
补充:SwS_wSw 的含义
SwS_wSw 叫合并样本标准差 ,它是两个样本方差的加权平均,权重是各自的自由度 n1−1n_1-1n1−1 和 n2−1n_2-1n2−1。当两个样本量相等(n1=n2=nn_1=n_2=nn1=n2=n)时,SwS_wSw 可以简化为:
Sw=(n−1)S12+(n−1)S222n−2=S12+S222 S_w = \sqrt{\frac{(n-1)S_1^2 + (n-1)S_2^2}{2n-2}} = \sqrt{\frac{S_1^2+S_2^2}{2}} Sw=2n−2(n−1)S12+(n−1)S22 =2S12+S22
3.3 P62 **两个正态总体方差比的置信区间(均值已知)**的完整推导过程
一、前提条件回顾
已知:
- 总体 X∼N(μ1,σ12)X \sim N(\mu_1, \sigma_1^2)X∼N(μ1,σ12),总体 Y∼N(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2)Y∼N(μ2,σ22),且两总体相互独立;
- 均值 μ1,μ2\mu_1, \mu_2μ1,μ2 已知,方差 σ12,σ22\sigma_1^2, \sigma_2^2σ12,σ22 未知,我们要估计它们的比值 σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22;
- X1,...,Xn1X_1,\dots,X_{n_1}X1,...,Xn1 是来自 XXX 的样本,Y1,...,Yn2Y_1,\dots,Y_{n_2}Y1,...,Yn2 是来自 YYY 的样本;
- 置信水平为 1−α1-\alpha1−α。
二、第一步:构造卡方分布变量
因为 Xi∼N(μ1,σ12)X_i \sim N(\mu_1, \sigma_1^2)Xi∼N(μ1,σ12),所以标准化后 Xi−μ1σ1∼N(0,1)\frac{X_i - \mu_1}{\sigma_1} \sim N(0,1)σ1Xi−μ1∼N(0,1)。
根据卡方分布的定义,独立标准正态变量的平方和服从卡方分布:
∑i=1n1(Xi−μ1σ1)2=1σ12∑i=1n1(Xi−μ1)2∼χ2(n1) \sum_{i=1}^{n_1} \left( \frac{X_i - \mu_1}{\sigma_1} \right)^2 = \frac{1}{\sigma_1^2} \sum_{i=1}^{n_1} (X_i - \mu_1)^2 \sim \chi^2(n_1) i=1∑n1(σ1Xi−μ1)2=σ121i=1∑n1(Xi−μ1)2∼χ2(n1)
同理,对 YYY 有:
∑j=1n2(Yj−μ2σ2)2=1σ22∑j=1n2(Yj−μ2)2∼χ2(n2) \sum_{j=1}^{n_2} \left( \frac{Y_j - \mu_2}{\sigma_2} \right)^2 = \frac{1}{\sigma_2^2} \sum_{j=1}^{n_2} (Y_j - \mu_2)^2 \sim \chi^2(n_2) j=1∑n2(σ2Yj−μ2)2=σ221j=1∑n2(Yj−μ2)2∼χ2(n2)
且这两个卡方变量相互独立(因为两总体独立)。
三、第二步:构造F分布枢轴量
F分布的定义是:若 U∼χ2(m)U \sim \chi^2(m)U∼χ2(m),V∼χ2(n)V \sim \chi^2(n)V∼χ2(n),且 UUU 与 VVV 独立,则
F=U/mV/n∼F(m,n) F = \frac{U/m}{V/n} \sim F(m,n) F=V/nU/m∼F(m,n)
我们把上面的两个卡方变量代入这个定义:
- U=1σ12∑i=1n1(Xi−μ1)2U = \frac{1}{\sigma_1^2} \sum_{i=1}^{n_1} (X_i - \mu_1)^2U=σ121∑i=1n1(Xi−μ1)2,自由度 m=n1m=n_1m=n1
- V=1σ22∑j=1n2(Yj−μ2)2V = \frac{1}{\sigma_2^2} \sum_{j=1}^{n_2} (Y_j - \mu_2)^2V=σ221∑j=1n2(Yj−μ2)2,自由度 n=n2n=n_2n=n2
于是得到枢轴量:
F=(1σ12∑i=1n1(Xi−μ1)2)/n1(1σ22∑j=1n2(Yj−μ2)2)/n2∼F(n1,n2) F = \frac{\left( \frac{1}{\sigma_1^2} \sum_{i=1}^{n_1} (X_i - \mu_1)^2 \right) / n_1}{\left( \frac{1}{\sigma_2^2} \sum_{j=1}^{n_2} (Y_j - \mu_2)^2 \right) / n_2} \sim F(n_1, n_2) F=(σ221∑j=1n2(Yj−μ2)2)/n2(σ121∑i=1n1(Xi−μ1)2)/n1∼F(n1,n2)
整理一下分子分母,把和参数无关的部分合并:
F=∑i=1n1(Xi−μ1)2/n1∑j=1n2(Yj−μ2)2/n2⋅σ22σ12∼F(n1,n2) F = \frac{\sum_{i=1}^{n_1} (X_i - \mu_1)^2 / n_1}{\sum_{j=1}^{n_2} (Y_j - \mu_2)^2 / n_2} \cdot \frac{\sigma_2^2}{\sigma_1^2} \sim F(n_1, n_2) F=∑j=1n2(Yj−μ2)2/n2∑i=1n1(Xi−μ1)2/n1⋅σ12σ22∼F(n1,n2)
这个枢轴量只含待估参数 σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22,且分布已知,完全符合要求。
四、第三步:利用F分布分位数建立概率等式
F分布是右偏分布,我们取双侧分位数,使得中间的概率为 1−α1-\alpha1−α:
P{F1−α2(n1,n2)<F<Fα2(n1,n2)}=1−α P\left\{ F_{1-\frac{\alpha}{2}}(n_1,n_2) < F < F_{\frac{\alpha}{2}}(n_1,n_2) \right\} = 1-\alpha P{F1−2α(n1,n2)<F<F2α(n1,n2)}=1−α
其中:
- Fα2(n1,n2)F_{\frac{\alpha}{2}}(n_1,n_2)F2α(n1,n2):上侧 α/2\alpha/2α/2 分位数(右侧面积为 α/2\alpha/2α/2);
- F1−α2(n1,n2)F_{1-\frac{\alpha}{2}}(n_1,n_2)F1−2α(n1,n2):上侧 1−α/21-\alpha/21−α/2 分位数(右侧面积为 1−α/21-\alpha/21−α/2,即左侧面积为 α/2\alpha/2α/2)。
把 FFF 的表达式代入不等式:
P{F1−α2(n1,n2)<∑i=1n1(Xi−μ1)2/n1∑j=1n2(Yj−μ2)2/n2⋅σ22σ12<Fα2(n1,n2)}=1−α P\left\{ F_{1-\frac{\alpha}{2}}(n_1,n_2) < \frac{\sum_{i=1}^{n_1} (X_i - \mu_1)^2 / n_1}{\sum_{j=1}^{n_2} (Y_j - \mu_2)^2 / n_2} \cdot \frac{\sigma_2^2}{\sigma_1^2} < F_{\frac{\alpha}{2}}(n_1,n_2) \right\} = 1-\alpha P{F1−2α(n1,n2)<∑j=1n2(Yj−μ2)2/n2∑i=1n1(Xi−μ1)2/n1⋅σ12σ22<F2α(n1,n2)}=1−α
五、第四步:解不等式,得到 σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22 的置信区间
我们的目标是把 σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22 单独放在中间,需要对不等式进行变形。
-
先把常数项移到两边:
令 A=∑i=1n1(Xi−μ1)2/n1∑j=1n2(Yj−μ2)2/n2A = \frac{\sum_{i=1}^{n_1} (X_i - \mu_1)^2 / n_1}{\sum_{j=1}^{n_2} (Y_j - \mu_2)^2 / n_2}A=∑j=1n2(Yj−μ2)2/n2∑i=1n1(Xi−μ1)2/n1,则不等式变为:
F1−α2<A⋅σ22σ12<Fα2 F_{1-\frac{\alpha}{2}} < A \cdot \frac{\sigma_2^2}{\sigma_1^2} < F_{\frac{\alpha}{2}} F1−2α<A⋅σ12σ22<F2α
-
对不等式取倒数(注意不等号方向反转):
1Fα2<1A⋅σ12σ22<1F1−α2 \frac{1}{F_{\frac{\alpha}{2}}} < \frac{1}{A} \cdot \frac{\sigma_1^2}{\sigma_2^2} < \frac{1}{F_{1-\frac{\alpha}{2}}} F2α1<A1⋅σ22σ12<F1−2α1
-
两边同时乘以 AAA(正数,不等号方向不变):
AFα2<σ12σ22<AF1−α2 \frac{A}{F_{\frac{\alpha}{2}}} < \frac{\sigma_1^2}{\sigma_2^2} < \frac{A}{F_{1-\frac{\alpha}{2}}} F2αA<σ22σ12<F1−2αA
-
把 AAA 代回原式,就得到了置信区间:
(∑i=1n1(Xi−μ1)2/n1Fα2(n1,n2)⋅∑j=1n2(Yj−μ2)2/n2,∑i=1n1(Xi−μ1)2/n1F1−α2(n1,n2)⋅∑j=1n2(Yj−μ2)2/n2) \boxed{ \left( \frac{\sum_{i=1}^{n_1} (X_i - \mu_1)^2 / n_1}{F_{\frac{\alpha}{2}}(n_1,n_2) \cdot \sum_{j=1}^{n_2} (Y_j - \mu_2)^2 / n_2}, \frac{\sum_{i=1}^{n_1} (X_i - \mu_1)^2 / n_1}{F_{1-\frac{\alpha}{2}}(n_1,n_2) \cdot \sum_{j=1}^{n_2} (Y_j - \mu_2)^2 / n_2} \right) } (F2α(n1,n2)⋅∑j=1n2(Yj−μ2)2/n2∑i=1n1(Xi−μ1)2/n1,F1−2α(n1,n2)⋅∑j=1n2(Yj−μ2)2/n2∑i=1n1(Xi−μ1)2/n1)
补充:F分布分位数的性质
这里有一个常用的性质:F1−α2(n1,n2)=1Fα2(n2,n1)F_{1-\frac{\alpha}{2}}(n_1,n_2) = \frac{1}{F_{\frac{\alpha}{2}}(n_2,n_1)}F1−2α(n1,n2)=F2α(n2,n1)1,因此置信区间的右端点也可以写成:
∑i=1n1(Xi−μ1)2/n1∑j=1n2(Yj−μ2)2/n2⋅Fα2(n2,n1) \frac{\sum_{i=1}^{n_1} (X_i - \mu_1)^2 / n_1}{\sum_{j=1}^{n_2} (Y_j - \mu_2)^2 / n_2} \cdot F_{\frac{\alpha}{2}}(n_2,n_1) ∑j=1n2(Yj−μ2)2/n2∑i=1n1(Xi−μ1)2/n1⋅F2α(n2,n1)
两种形式是等价的,只是写法不同。
3.3 P64 **两个正态总体方差比的置信区间(均值未知)**的完整推导过程
一、前提条件回顾
已知:
- 总体 X∼N(μ1,σ12)X \sim N(\mu_1, \sigma_1^2)X∼N(μ1,σ12),总体 Y∼N(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2)Y∼N(μ2,σ22),且两总体相互独立;
- 均值 μ1,μ2\mu_1, \mu_2μ1,μ2 未知,方差 σ12,σ22\sigma_1^2, \sigma_2^2σ12,σ22 未知,我们要估计它们的比值 σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22;
- X1,...,Xn1X_1,\dots,X_{n_1}X1,...,Xn1 是来自 XXX 的样本,样本方差 S12=1n1−1∑i=1n1(Xi−Xˉ)2S_1^2 = \frac{1}{n_1-1}\sum_{i=1}^{n_1}(X_i-\bar{X})^2S12=n1−11∑i=1n1(Xi−Xˉ)2;
- Y1,...,Yn2Y_1,\dots,Y_{n_2}Y1,...,Yn2 是来自 YYY 的样本,样本方差 S22=1n2−1∑j=1n2(Yj−Yˉ)2S_2^2 = \frac{1}{n_2-1}\sum_{j=1}^{n_2}(Y_j-\bar{Y})^2S22=n2−11∑j=1n2(Yj−Yˉ)2;
- 置信水平为 1−α1-\alpha1−α。
二、第一步:构造卡方分布变量(关键:均值未知时自由度减1)
当均值未知时,我们需要用样本均值 Xˉ\bar{X}Xˉ 和 Yˉ\bar{Y}Yˉ 代替真实均值,此时:
-
对总体 XXX,有:
(n1−1)S12σ12∼χ2(n1−1) \frac{(n_1-1)S_1^2}{\sigma_1^2} \sim \chi^2(n_1-1) σ12(n1−1)S12∼χ2(n1−1)
自由度为 n1−1n_1-1n1−1,因为我们用样本均值估计了真实均值,损失了1个自由度。
-
同理,对总体 YYY,有:
(n2−1)S22σ22∼χ2(n2−1) \frac{(n_2-1)S_2^2}{\sigma_2^2} \sim \chi^2(n_2-1) σ22(n2−1)S22∼χ2(n2−1)
自由度为 n2−1n_2-1n2−1。
这两个卡方变量相互独立(因为两总体独立)。
三、第二步:构造F分布枢轴量
F分布的定义是:若 U∼χ2(m)U \sim \chi^2(m)U∼χ2(m),V∼χ2(n)V \sim \chi^2(n)V∼χ2(n),且 UUU 与 VVV 独立,则
F=U/mV/n∼F(m,n) F = \frac{U/m}{V/n} \sim F(m,n) F=V/nU/m∼F(m,n)
我们把上面的两个卡方变量代入这个定义:
- U=(n1−1)S12σ12U = \frac{(n_1-1)S_1^2}{\sigma_1^2}U=σ12(n1−1)S12,自由度 m=n1−1m=n_1-1m=n1−1
- V=(n2−1)S22σ22V = \frac{(n_2-1)S_2^2}{\sigma_2^2}V=σ22(n2−1)S22,自由度 n=n2−1n=n_2-1n=n2−1
于是得到枢轴量:
F=U/mV/n=((n1−1)S12σ12)/(n1−1)((n2−1)S22σ22)/(n2−1) F = \frac{U/m}{V/n} = \frac{\left( \frac{(n_1-1)S_1^2}{\sigma_1^2} \right) / (n_1-1)}{\left( \frac{(n_2-1)S_2^2}{\sigma_2^2} \right) / (n_2-1)} F=V/nU/m=(σ22(n2−1)S22)/(n2−1)(σ12(n1−1)S12)/(n1−1)
化简分子分母:
F=S12/σ12S22/σ22=S12S22⋅σ22σ12∼F(n1−1,n2−1) F = \frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_2^2} = \frac{S_1^2}{S_2^2} \cdot \frac{\sigma_2^2}{\sigma_1^2} \sim F(n_1-1, n_2-1) F=S22/σ22S12/σ12=S22S12⋅σ12σ22∼F(n1−1,n2−1)
这个枢轴量只含待估参数 σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22,且分布已知,完全符合要求。
四、第三步:利用F分布分位数建立概率等式
F分布是右偏分布,我们取双侧分位数,使得中间的概率为 1−α1-\alpha1−α:
P{F1−α2(n1−1,n2−1)<F<Fα2(n1−1,n2−1)}=1−α P\left\{ F_{1-\frac{\alpha}{2}}(n_1-1,n_2-1) < F < F_{\frac{\alpha}{2}}(n_1-1,n_2-1) \right\} = 1-\alpha P{F1−2α(n1−1,n2−1)<F<F2α(n1−1,n2−1)}=1−α
其中:
- Fα2(n1−1,n2−1)F_{\frac{\alpha}{2}}(n_1-1,n_2-1)F2α(n1−1,n2−1):上侧 α/2\alpha/2α/2 分位数(右侧面积为 α/2\alpha/2α/2);
- F1−α2(n1−1,n2−1)F_{1-\frac{\alpha}{2}}(n_1-1,n_2-1)F1−2α(n1−1,n2−1):上侧 1−α/21-\alpha/21−α/2 分位数(右侧面积为 1−α/21-\alpha/21−α/2,即左侧面积为 α/2\alpha/2α/2)。
把 FFF 的表达式代入不等式:
P{F1−α2(n1−1,n2−1)<S12S22⋅σ22σ12<Fα2(n1−1,n2−1)}=1−α P\left\{ F_{1-\frac{\alpha}{2}}(n_1-1,n_2-1) < \frac{S_1^2}{S_2^2} \cdot \frac{\sigma_2^2}{\sigma_1^2} < F_{\frac{\alpha}{2}}(n_1-1,n_2-1) \right\} = 1-\alpha P{F1−2α(n1−1,n2−1)<S22S12⋅σ12σ22<F2α(n1−1,n2−1)}=1−α
五、第四步:解不等式,得到 σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22 的置信区间
我们的目标是把 σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22 单独放在中间,对不等式进行变形。
-
先把常数项移到两边:
令 A=S12S22A = \frac{S_1^2}{S_2^2}A=S22S12,则不等式变为:
F1−α2<A⋅σ22σ12<Fα2 F_{1-\frac{\alpha}{2}} < A \cdot \frac{\sigma_2^2}{\sigma_1^2} < F_{\frac{\alpha}{2}} F1−2α<A⋅σ12σ22<F2α
-
对不等式取倒数(注意不等号方向反转):
1Fα2<1A⋅σ12σ22<1F1−α2 \frac{1}{F_{\frac{\alpha}{2}}} < \frac{1}{A} \cdot \frac{\sigma_1^2}{\sigma_2^2} < \frac{1}{F_{1-\frac{\alpha}{2}}} F2α1<A1⋅σ22σ12<F1−2α1
-
两边同时乘以 AAA(正数,不等号方向不变):
AFα2<σ12σ22<AF1−α2 \frac{A}{F_{\frac{\alpha}{2}}} < \frac{\sigma_1^2}{\sigma_2^2} < \frac{A}{F_{1-\frac{\alpha}{2}}} F2αA<σ22σ12<F1−2αA
-
把 A=S12S22A = \frac{S_1^2}{S_2^2}A=S22S12 代回原式,就得到了置信区间:
(S12S22Fα2(n1−1,n2−1),S12S22F1−α2(n1−1,n2−1)) \boxed{ \left( \frac{S_1^2}{S_2^2 F_{\frac{\alpha}{2}}(n_1-1,n_2-1)}, \frac{S_1^2}{S_2^2 F_{1-\frac{\alpha}{2}}(n_1-1,n_2-1)} \right) } (S22F2α(n1−1,n2−1)S12,S22F1−2α(n1−1,n2−1)S12)
补充:F分布分位数的常用性质
这里有一个关键性质:F1−α2(n1−1,n2−1)=1Fα2(n2−1,n1−1)F_{1-\frac{\alpha}{2}}(n_1-1,n_2-1) = \frac{1}{F_{\frac{\alpha}{2}}(n_2-1,n_1-1)}F1−2α(n1−1,n2−1)=F2α(n2−1,n1−1)1,因此置信区间的右端点也可以写成:
S12S22⋅Fα2(n2−1,n1−1) \frac{S_1^2}{S_2^2} \cdot F_{\frac{\alpha}{2}}(n_2-1,n_1-1) S22S12⋅F2α(n2−1,n1−1)
两种形式是等价的,只是写法不同,用这个性质计算时会更方便。
3.3 P80 **「单侧置信限」和「双侧置信区间」**的区别
一、先搞懂:置信区间的本质是"概率覆盖"
不管单侧还是双侧,置信区间的核心都是:
我们找一个区间/边界,让"真实参数落在这个范围内"的概率等于置信水平 1−α1-\alpha1−α。
- 双侧置信区间:我们关心的是"参数大概在哪个中间范围",比如"均值在14, 16之间"。
- 单侧置信限:我们只关心一个方向,比如"寿命至少不低于多少?"(下限)或者"方差最多不超过多少?"(上限),不关心另一边。
二、为什么单侧不能直接用双侧的结论?
你说的"单侧上限不是双侧的下限吗?",其实是混淆了分位数的定义 和不等式的方向,我们一步步拆解。
1. 先回顾双侧置信区间的逻辑(以方差为例)
双侧置信区间的概率等式是:
P{χ1−α22(n−1)<(n−1)S2σ2<χα22(n−1)}=1−α P\left\{ \chi^2_{1-\frac{\alpha}{2}}(n-1) < \frac{(n-1)S^2}{\sigma^2} < \chi^2_{\frac{\alpha}{2}}(n-1) \right\} = 1-\alpha P{χ1−2α2(n−1)<σ2(n−1)S2<χ2α2(n−1)}=1−α
它把 α\alphaα 分成了两部分:
- 左边尾部:P{(n−1)S2σ2≤χ1−α22}=α2P\left\{ \frac{(n-1)S^2}{\sigma^2} \le \chi^2_{1-\frac{\alpha}{2}} \right\} = \frac{\alpha}{2}P{σ2(n−1)S2≤χ1−2α2}=2α
- 右边尾部:P{(n−1)S2σ2≥χα22}=α2P\left\{ \frac{(n-1)S^2}{\sigma^2} \ge \chi^2_{\frac{\alpha}{2}} \right\} = \frac{\alpha}{2}P{σ2(n−1)S2≥χ2α2}=2α
变形后得到的双侧区间是:
((n−1)S2χα22, (n−1)S2χ1−α22) \left( \frac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}},\ \frac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}} \right) (χ2α2(n−1)S2, χ1−2α2(n−1)S2)
这里的两个端点,分别对应卡方分布的两个分位数。
2. 再看单侧置信上限的逻辑(题目第二问)
单侧置信上限,我们只要求:
P{σ2≤上限}=1−α P\left\{ \sigma^2 \le \text{上限} \right\} = 1-\alpha P{σ2≤上限}=1−α
也就是"方差小于等于这个上限的概率是 1−α1-\alpha1−α",对应的尾部概率只在卡方分布的左侧。
第一步:从枢轴量出发
我们还是用同一个枢轴量:
χ2=(n−1)S2σ2∼χ2(n−1) \chi^2 = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) χ2=σ2(n−1)S2∼χ2(n−1)
第二步:只控制一侧的尾部
我们要让"σ2\sigma^2σ2 小于某个值"的概率是 1−α1-\alpha1−α,等价于:
P{(n−1)S2σ2≥χ1−α2(n−1)}=1−α P\left\{ \frac{(n-1)S^2}{\sigma^2} \ge \chi^2_{1-\alpha}(n-1) \right\} = 1-\alpha P{σ2(n−1)S2≥χ1−α2(n−1)}=1−α
这里的 χ1−α2(n−1)\chi^2_{1-\alpha}(n-1)χ1−α2(n−1) 是卡方分布的下侧分位数:
- 它的定义是:P{χ2≥χ1−α2}=1−αP\left\{ \chi^2 \ge \chi^2_{1-\alpha} \right\} = 1-\alphaP{χ2≥χ1−α2}=1−α
- 也就是"卡方变量大于这个分位数的概率是 1−α1-\alpha1−α",剩下的左侧尾部概率是 α\alphaα。
第三步:变形不等式,得到上限
把枢轴量代入,解出 σ2\sigma^2σ2:
(n−1)S2σ2≥χ1−α2 \frac{(n-1)S^2}{\sigma^2} \ge \chi^2_{1-\alpha} σ2(n−1)S2≥χ1−α2
两边同时乘以 σ2\sigma^2σ2,再除以 χ1−α2\chi^2_{1-\alpha}χ1−α2(都是正数,不等号方向不变):
σ2≤(n−1)S2χ1−α2 \sigma^2 \le \frac{(n-1)S^2}{\chi^2_{1-\alpha}} σ2≤χ1−α2(n−1)S2
所以单侧置信上限就是 (n−1)S2χ1−α2\frac{(n-1)S^2}{\chi^2_{1-\alpha}}χ1−α2(n−1)S2。
3. 为什么单侧上限≠双侧的下限?
我们对比一下:
- 双侧置信区间的左端点 :(n−1)S2χα22\frac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}}χ2α2(n−1)S2
- 单侧置信上限:(n−1)S2χ1−α2\frac{(n-1)S^2}{\chi^2_{1-\alpha}}χ1−α2(n−1)S2
这两个用的分位数完全不一样:
- 双侧用的是 χα22\chi^2_{\frac{\alpha}{2}}χ2α2(上侧 α/2\alpha/2α/2 分位数,右侧尾部概率 α/2\alpha/2α/2)
- 单侧用的是 χ1−α2\chi^2_{1-\alpha}χ1−α2(下侧 1−α1-\alpha1−α 分位数,左侧尾部概率 α\alphaα)
举个例子,题目里 α=0.1\alpha=0.1α=0.1,n−1=5n-1=5n−1=5:
- 双侧的分位数:χ0.052(5)=11.070\chi^2_{0.05}(5)=11.070χ0.052(5)=11.070,χ0.952(5)=1.145\chi^2_{0.95}(5)=1.145χ0.952(5)=1.145
- 单侧的分位数:χ0.92(5)=1.610\chi^2_{0.9}(5)=1.610χ0.92(5)=1.610
可以看到,χ0.92(5)≠χ0.052(5)\chi^2_{0.9}(5) \neq \chi^2_{0.05}(5)χ0.92(5)=χ0.052(5),所以单侧上限和双侧下限的数值也不一样,不能直接混用。
三、再用"单侧置信下限"帮你理解
如果我们要找方差的单侧置信下限,逻辑是类似的:
P{σ2≥下限}=1−α P\left\{ \sigma^2 \ge \text{下限} \right\} = 1-\alpha P{σ2≥下限}=1−α
对应的枢轴量概率等式是:
P{(n−1)S2σ2≤χα2(n−1)}=1−α P\left\{ \frac{(n-1)S^2}{\sigma^2} \le \chi^2_{\alpha}(n-1) \right\} = 1-\alpha P{σ2(n−1)S2≤χα2(n−1)}=1−α
变形后得到:
σ2≥(n−1)S2χα2 \sigma^2 \ge \frac{(n-1)S^2}{\chi^2_{\alpha}} σ2≥χα2(n−1)S2
这里用的是上侧 α\alphaα 分位数 χα2\chi^2_{\alpha}χα2,和双侧的 χα/22\chi^2_{\alpha/2}χα/22 也不一样。
四、一句话总结核心区别
| 类型 | 我们关心的概率 | 控制的尾部 | 使用的分位数 | 公式形式 |
|---|---|---|---|---|
| 双侧置信区间 | P(L<σ2<U)=1−αP(L<\sigma^2<U)=1-\alphaP(L<σ2<U)=1−α | 左右各 α/2\alpha/2α/2 | χα/22\chi^2_{\alpha/2}χα/22 和 χ1−α/22\chi^2_{1-\alpha/2}χ1−α/22 | 两个端点 |
| 单侧置信上限 | P(σ2≤U)=1−αP(\sigma^2 \le U)=1-\alphaP(σ2≤U)=1−α | 左侧 α\alphaα | χ1−α2\chi^2_{1-\alpha}χ1−α2 | 一个上限 |
| 单侧置信下限 | P(σ2≥L)=1−αP(\sigma^2 \ge L)=1-\alphaP(σ2≥L)=1−α | 右侧 α\alphaα | χα2\chi^2_{\alpha}χα2 | 一个下限 |
关键:单侧只控制一个方向的尾部概率,所以只用一个分位数;双侧控制两个方向的尾部,所以用两个分位数,不能直接混用。