数理统计区间估计部分内容推导补充记录

3.3 P60 **两个正态总体均值差的置信区间（方差未知但相等）**的推导过程

一、前提条件回顾

已知：

总体 X∼N(μ1,σ12)X \sim N(\mu_1, \sigma_1^2)X∼N(μ1,σ12)，总体 Y∼N(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2)Y∼N(μ2,σ22)，且两总体相互独立；
方差未知，但假设 σ12=σ22=σ2\sigma_1^2 = \sigma_2^2 = \sigma^2σ12=σ22=σ2（方差齐性）；
X1,...,Xn1X_1,\dots,X_{n_1}X1,...,Xn1 是来自 XXX 的样本，样本均值 Xˉ\bar{X}Xˉ，样本方差 S12=1n1−1∑i=1n1(Xi−Xˉ)2S_1^2 = \frac{1}{n_1-1}\sum_{i=1}^{n_1}(X_i-\bar{X})^2S12=n1−11∑i=1n1(Xi−Xˉ)2；
Y1,...,Yn2Y_1,\dots,Y_{n_2}Y1,...,Yn2 是来自 YYY 的样本，样本均值 Yˉ\bar{Y}Yˉ，样本方差 S22=1n2−1∑j=1n2(Yj−Yˉ)2S_2^2 = \frac{1}{n_2-1}\sum_{j=1}^{n_2}(Y_j-\bar{Y})^2S22=n2−11∑j=1n2(Yj−Yˉ)2；
我们要估计的是均值差 μ1−μ2\mu_1-\mu_2μ1−μ2，置信水平为 1−α1-\alpha1−α。

二、第一步：构造标准正态变量 UUU

因为两个总体独立且正态，所以样本均值差 Xˉ−Yˉ\bar{X}-\bar{Y}Xˉ−Yˉ 也服从正态分布：

Xˉ∼N(μ1,σ2n1),Yˉ∼N(μ2,σ2n2) \bar{X} \sim N\left(\mu_1, \frac{\sigma^2}{n_1}\right),\quad \bar{Y} \sim N\left(\mu_2, \frac{\sigma^2}{n_2}\right) Xˉ∼N(μ1,n1σ2),Yˉ∼N(μ2,n2σ2)

因此：

Xˉ−Yˉ∼N(μ1−μ2, σ2(1n1+1n2)) \bar{X} - \bar{Y} \sim N\left(\mu_1-\mu_2,\ \sigma^2\left(\frac{1}{n_1}+\frac{1}{n_2}\right)\right) Xˉ−Yˉ∼N(μ1−μ2, σ2(n11+n21))

对其标准化，得到：

U=(Xˉ−Yˉ)−(μ1−μ2)σ1n1+1n2∼N(0,1) U = \frac{(\bar{X}-\bar{Y}) - (\mu_1-\mu_2)}{\sigma\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim N(0,1) U=σn11+n21 (Xˉ−Yˉ)−(μ1−μ2)∼N(0,1)

这就是分析里的 UUU，但它含有未知的 σ\sigmaσ，不能直接作为枢轴量。

三、第二步：构造卡方变量 χ2\chi^2χ2

对于单个正态总体，我们知道：

(n1−1)S12σ2∼χ2(n1−1),(n2−1)S22σ2∼χ2(n2−1) \frac{(n_1-1)S_1^2}{\sigma^2} \sim \chi^2(n_1-1),\quad \frac{(n_2-1)S_2^2}{\sigma^2} \sim \chi^2(n_2-1) σ2(n1−1)S12∼χ2(n1−1),σ2(n2−1)S22∼χ2(n2−1)

且这两个统计量相互独立（因为两总体独立）。根据卡方分布的可加性：

χ2=(n1−1)S12σ2+(n2−1)S22σ2∼χ2(n1+n2−2) \chi^2 = \frac{(n_1-1)S_1^2}{\sigma^2} + \frac{(n_2-1)S_2^2}{\sigma^2} \sim \chi^2(n_1+n_2-2) χ2=σ2(n1−1)S12+σ2(n2−1)S22∼χ2(n1+n2−2)

这就是分析里的 χ2\chi^2χ2，自由度是两个自由度之和 (n1−1)+(n2−1)=n1+n2−2(n_1-1)+(n_2-1)=n_1+n_2-2(n1−1)+(n2−1)=n1+n2−2。

四、第三步：构造 ttt 分布枢轴量 TTT

ttt 分布的定义是：若 Z∼N(0,1)Z \sim N(0,1)Z∼N(0,1)，W∼χ2(m)W \sim \chi^2(m)W∼χ2(m)，且 ZZZ 与 WWW 独立，则

T=ZW/m∼t(m) T = \frac{Z}{\sqrt{W/m}} \sim t(m) T=W/m Z∼t(m)

我们把前面的 UUU 和 χ2\chi^2χ2 代入这个定义：

Z=UZ = UZ=U（标准正态）
W=χ2W = \chi^2W=χ2（卡方分布，自由度 m=n1+n2−2m=n_1+n_2-2m=n1+n2−2）

于是得到：

T=Uχ2/(n1+n2−2) T = \frac{U}{\sqrt{\chi^2/(n_1+n_2-2)}} T=χ2/(n1+n2−2) U

把 UUU 和 χ2\chi^2χ2 的表达式代入：

T=(Xˉ−Yˉ)−(μ1−μ2)σ1n1+1n21n1+n2−2((n1−1)S12σ2+(n2−1)S22σ2) T = \frac{\frac{(\bar{X}-\bar{Y}) - (\mu_1-\mu_2)}{\sigma\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}}{\sqrt{\frac{1}{n_1+n_2-2}\left( \frac{(n_1-1)S_1^2}{\sigma^2} + \frac{(n_2-1)S_2^2}{\sigma^2} \right)}} T=n1+n2−21(σ2(n1−1)S12+σ2(n2−1)S22) σn11+n21 (Xˉ−Yˉ)−(μ1−μ2)

接下来我们化简分母里的根号项：

1n1+n2−2⋅(n1−1)S12+(n2−1)S22σ2=1σ⋅(n1−1)S12+(n2−1)S22n1+n2−2⏟Sw \sqrt{\frac{1}{n_1+n_2-2} \cdot \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{\sigma^2}} = \frac{1}{\sigma} \cdot \underbrace{\sqrt{\frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2}}}_{S_w} n1+n2−21⋅σ2(n1−1)S12+(n2−1)S22 =σ1⋅Sw n1+n2−2(n1−1)S12+(n2−1)S22

这里的 SwS_wSw 就是题目里定义的合并样本标准差 ：

Sw=(n1−1)S12+(n2−1)S22n1+n2−2 S_w = \sqrt{\frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2}} Sw=n1+n2−2(n1−1)S12+(n2−1)S22

把化简后的分母代回 TTT 的表达式，σ\sigmaσ 会被约掉：

T=(Xˉ−Yˉ)−(μ1−μ2)Sw1n1+1n2∼t(n1+n2−2) T = \frac{(\bar{X}-\bar{Y}) - (\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim t(n_1+n_2-2) T=Swn11+n21 (Xˉ−Yˉ)−(μ1−μ2)∼t(n1+n2−2)

这就是我们需要的枢轴量，它只含待估参数 μ1−μ2\mu_1-\mu_2μ1−μ2，且分布已知。

五、第四步：利用 ttt 分布分位数建立概率等式

根据 ttt 分布的双侧分位数定义，有：

P{−tα2(n1+n2−2)<T<tα2(n1+n2−2)}=1−α P\left\{ -t_{\frac{\alpha}{2}}(n_1+n_2-2) < T < t_{\frac{\alpha}{2}}(n_1+n_2-2) \right\} = 1-\alpha P{−t2α(n1+n2−2)<T<t2α(n1+n2−2)}=1−α

把 TTT 的表达式代入不等式：

P{−tα2(n1+n2−2)<(Xˉ−Yˉ)−(μ1−μ2)Sw1n1+1n2<tα2(n1+n2−2)}=1−α P\left\{ -t_{\frac{\alpha}{2}}(n_1+n_2-2) < \frac{(\bar{X}-\bar{Y}) - (\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} < t_{\frac{\alpha}{2}}(n_1+n_2-2) \right\} = 1-\alpha P⎩ ⎨ ⎧−t2α(n1+n2−2)<Swn11+n21 (Xˉ−Yˉ)−(μ1−μ2)<t2α(n1+n2−2)⎭ ⎬ ⎫=1−α

六、第五步：解不等式，得到 μ1−μ2\mu_1-\mu_2μ1−μ2 的置信区间

我们把不等式变形，把 μ1−μ2\mu_1-\mu_2μ1−μ2 单独放在中间：

给不等式两边同时乘以 Sw1n1+1n2S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}Swn11+n21 （正数，不等号方向不变）：

−tα2⋅Sw1n1+1n2<(Xˉ−Yˉ)−(μ1−μ2)<tα2⋅Sw1n1+1n2 -t_{\frac{\alpha}{2}} \cdot S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}} < (\bar{X}-\bar{Y}) - (\mu_1-\mu_2) < t_{\frac{\alpha}{2}} \cdot S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}} −t2α⋅Swn11+n21 <(Xˉ−Yˉ)−(μ1−μ2)<t2α⋅Swn11+n21
把 (Xˉ−Yˉ)(\bar{X}-\bar{Y})(Xˉ−Yˉ) 移到不等式两边，不等号方向反转：

(Xˉ−Yˉ)−tα2⋅Sw1n1+1n2<μ1−μ2<(Xˉ−Yˉ)+tα2⋅Sw1n1+1n2 (\bar{X}-\bar{Y}) - t_{\frac{\alpha}{2}} \cdot S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}} < \mu_1-\mu_2 < (\bar{X}-\bar{Y}) + t_{\frac{\alpha}{2}} \cdot S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}} (Xˉ−Yˉ)−t2α⋅Swn11+n21 <μ1−μ2<(Xˉ−Yˉ)+t2α⋅Swn11+n21

这就得到了置信水平为 1−α1-\alpha1−α 的置信区间，写成题目里的形式就是：

((Xˉ−Yˉ)±Sw1n1+1n2tα2(n1+n2−2)) \boxed{ \left( (\bar{X}-\bar{Y}) \pm S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}} t_{\frac{\alpha}{2}}(n_1+n_2-2) \right) } ((Xˉ−Yˉ)±Swn11+n21 t2α(n1+n2−2))

补充：SwS_wSw 的含义

SwS_wSw 叫合并样本标准差 ，它是两个样本方差的加权平均，权重是各自的自由度 n1−1n_1-1n1−1 和 n2−1n_2-1n2−1。当两个样本量相等（n1=n2=nn_1=n_2=nn1=n2=n）时，SwS_wSw 可以简化为：

Sw=(n−1)S12+(n−1)S222n−2=S12+S222 S_w = \sqrt{\frac{(n-1)S_1^2 + (n-1)S_2^2}{2n-2}} = \sqrt{\frac{S_1^2+S_2^2}{2}} Sw=2n−2(n−1)S12+(n−1)S22 =2S12+S22

3.3 P62 **两个正态总体方差比的置信区间（均值已知）**的完整推导过程

一、前提条件回顾

已知：

总体 X∼N(μ1,σ12)X \sim N(\mu_1, \sigma_1^2)X∼N(μ1,σ12)，总体 Y∼N(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2)Y∼N(μ2,σ22)，且两总体相互独立；
均值 μ1,μ2\mu_1, \mu_2μ1,μ2 已知，方差 σ12,σ22\sigma_1^2, \sigma_2^2σ12,σ22 未知，我们要估计它们的比值 σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22；
X1,...,Xn1X_1,\dots,X_{n_1}X1,...,Xn1 是来自 XXX 的样本，Y1,...,Yn2Y_1,\dots,Y_{n_2}Y1,...,Yn2 是来自 YYY 的样本；
置信水平为 1−α1-\alpha1−α。

二、第一步：构造卡方分布变量

因为 Xi∼N(μ1,σ12)X_i \sim N(\mu_1, \sigma_1^2)Xi∼N(μ1,σ12)，所以标准化后 Xi−μ1σ1∼N(0,1)\frac{X_i - \mu_1}{\sigma_1} \sim N(0,1)σ1Xi−μ1∼N(0,1)。

根据卡方分布的定义，独立标准正态变量的平方和服从卡方分布：

∑i=1n1(Xi−μ1σ1)2=1σ12∑i=1n1(Xi−μ1)2∼χ2(n1) \sum_{i=1}^{n_1} \left( \frac{X_i - \mu_1}{\sigma_1} \right)^2 = \frac{1}{\sigma_1^2} \sum_{i=1}^{n_1} (X_i - \mu_1)^2 \sim \chi^2(n_1) i=1∑n1(σ1Xi−μ1)2=σ121i=1∑n1(Xi−μ1)2∼χ2(n1)

同理，对 YYY 有：

∑j=1n2(Yj−μ2σ2)2=1σ22∑j=1n2(Yj−μ2)2∼χ2(n2) \sum_{j=1}^{n_2} \left( \frac{Y_j - \mu_2}{\sigma_2} \right)^2 = \frac{1}{\sigma_2^2} \sum_{j=1}^{n_2} (Y_j - \mu_2)^2 \sim \chi^2(n_2) j=1∑n2(σ2Yj−μ2)2=σ221j=1∑n2(Yj−μ2)2∼χ2(n2)

且这两个卡方变量相互独立（因为两总体独立）。

三、第二步：构造F分布枢轴量

F分布的定义是：若 U∼χ2(m)U \sim \chi^2(m)U∼χ2(m)，V∼χ2(n)V \sim \chi^2(n)V∼χ2(n)，且 UUU 与 VVV 独立，则

F=U/mV/n∼F(m,n) F = \frac{U/m}{V/n} \sim F(m,n) F=V/nU/m∼F(m,n)

我们把上面的两个卡方变量代入这个定义：

U=1σ12∑i=1n1(Xi−μ1)2U = \frac{1}{\sigma_1^2} \sum_{i=1}^{n_1} (X_i - \mu_1)^2U=σ121∑i=1n1(Xi−μ1)2，自由度 m=n1m=n_1m=n1
V=1σ22∑j=1n2(Yj−μ2)2V = \frac{1}{\sigma_2^2} \sum_{j=1}^{n_2} (Y_j - \mu_2)^2V=σ221∑j=1n2(Yj−μ2)2，自由度 n=n2n=n_2n=n2

于是得到枢轴量：

F=(1σ12∑i=1n1(Xi−μ1)2)/n1(1σ22∑j=1n2(Yj−μ2)2)/n2∼F(n1,n2) F = \frac{\left( \frac{1}{\sigma_1^2} \sum_{i=1}^{n_1} (X_i - \mu_1)^2 \right) / n_1}{\left( \frac{1}{\sigma_2^2} \sum_{j=1}^{n_2} (Y_j - \mu_2)^2 \right) / n_2} \sim F(n_1, n_2) F=(σ221∑j=1n2(Yj−μ2)2)/n2(σ121∑i=1n1(Xi−μ1)2)/n1∼F(n1,n2)

整理一下分子分母，把和参数无关的部分合并：

F=∑i=1n1(Xi−μ1)2/n1∑j=1n2(Yj−μ2)2/n2⋅σ22σ12∼F(n1,n2) F = \frac{\sum_{i=1}^{n_1} (X_i - \mu_1)^2 / n_1}{\sum_{j=1}^{n_2} (Y_j - \mu_2)^2 / n_2} \cdot \frac{\sigma_2^2}{\sigma_1^2} \sim F(n_1, n_2) F=∑j=1n2(Yj−μ2)2/n2∑i=1n1(Xi−μ1)2/n1⋅σ12σ22∼F(n1,n2)

这个枢轴量只含待估参数 σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22，且分布已知，完全符合要求。

四、第三步：利用F分布分位数建立概率等式

F分布是右偏分布，我们取双侧分位数，使得中间的概率为 1−α1-\alpha1−α：

P{F1−α2(n1,n2)<F<Fα2(n1,n2)}=1−α P\left\{ F_{1-\frac{\alpha}{2}}(n_1,n_2) < F < F_{\frac{\alpha}{2}}(n_1,n_2) \right\} = 1-\alpha P{F1−2α(n1,n2)<F<F2α(n1,n2)}=1−α

其中：

Fα2(n1,n2)F_{\frac{\alpha}{2}}(n_1,n_2)F2α(n1,n2)：上侧 α/2\alpha/2α/2 分位数（右侧面积为 α/2\alpha/2α/2）；
F1−α2(n1,n2)F_{1-\frac{\alpha}{2}}(n_1,n_2)F1−2α(n1,n2)：上侧 1−α/21-\alpha/21−α/2 分位数（右侧面积为 1−α/21-\alpha/21−α/2，即左侧面积为 α/2\alpha/2α/2）。

把 FFF 的表达式代入不等式：

P{F1−α2(n1,n2)<∑i=1n1(Xi−μ1)2/n1∑j=1n2(Yj−μ2)2/n2⋅σ22σ12<Fα2(n1,n2)}=1−α P\left\{ F_{1-\frac{\alpha}{2}}(n_1,n_2) < \frac{\sum_{i=1}^{n_1} (X_i - \mu_1)^2 / n_1}{\sum_{j=1}^{n_2} (Y_j - \mu_2)^2 / n_2} \cdot \frac{\sigma_2^2}{\sigma_1^2} < F_{\frac{\alpha}{2}}(n_1,n_2) \right\} = 1-\alpha P{F1−2α(n1,n2)<∑j=1n2(Yj−μ2)2/n2∑i=1n1(Xi−μ1)2/n1⋅σ12σ22<F2α(n1,n2)}=1−α

五、第四步：解不等式，得到 σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22 的置信区间

我们的目标是把 σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22 单独放在中间，需要对不等式进行变形。

先把常数项移到两边：

令 A=∑i=1n1(Xi−μ1)2/n1∑j=1n2(Yj−μ2)2/n2A = \frac{\sum_{i=1}^{n_1} (X_i - \mu_1)^2 / n_1}{\sum_{j=1}^{n_2} (Y_j - \mu_2)^2 / n_2}A=∑j=1n2(Yj−μ2)2/n2∑i=1n1(Xi−μ1)2/n1，则不等式变为：

F1−α2<A⋅σ22σ12<Fα2 F_{1-\frac{\alpha}{2}} < A \cdot \frac{\sigma_2^2}{\sigma_1^2} < F_{\frac{\alpha}{2}} F1−2α<A⋅σ12σ22<F2α
对不等式取倒数（注意不等号方向反转）：

1Fα2<1A⋅σ12σ22<1F1−α2 \frac{1}{F_{\frac{\alpha}{2}}} < \frac{1}{A} \cdot \frac{\sigma_1^2}{\sigma_2^2} < \frac{1}{F_{1-\frac{\alpha}{2}}} F2α1<A1⋅σ22σ12<F1−2α1
两边同时乘以 AAA（正数，不等号方向不变）：

AFα2<σ12σ22<AF1−α2 \frac{A}{F_{\frac{\alpha}{2}}} < \frac{\sigma_1^2}{\sigma_2^2} < \frac{A}{F_{1-\frac{\alpha}{2}}} F2αA<σ22σ12<F1−2αA
把 AAA 代回原式，就得到了置信区间：

(∑i=1n1(Xi−μ1)2/n1Fα2(n1,n2)⋅∑j=1n2(Yj−μ2)2/n2,∑i=1n1(Xi−μ1)2/n1F1−α2(n1,n2)⋅∑j=1n2(Yj−μ2)2/n2) \boxed{ \left( \frac{\sum_{i=1}^{n_1} (X_i - \mu_1)^2 / n_1}{F_{\frac{\alpha}{2}}(n_1,n_2) \cdot \sum_{j=1}^{n_2} (Y_j - \mu_2)^2 / n_2}, \frac{\sum_{i=1}^{n_1} (X_i - \mu_1)^2 / n_1}{F_{1-\frac{\alpha}{2}}(n_1,n_2) \cdot \sum_{j=1}^{n_2} (Y_j - \mu_2)^2 / n_2} \right) } (F2α(n1,n2)⋅∑j=1n2(Yj−μ2)2/n2∑i=1n1(Xi−μ1)2/n1,F1−2α(n1,n2)⋅∑j=1n2(Yj−μ2)2/n2∑i=1n1(Xi−μ1)2/n1)

补充：F分布分位数的性质

这里有一个常用的性质：F1−α2(n1,n2)=1Fα2(n2,n1)F_{1-\frac{\alpha}{2}}(n_1,n_2) = \frac{1}{F_{\frac{\alpha}{2}}(n_2,n_1)}F1−2α(n1,n2)=F2α(n2,n1)1，因此置信区间的右端点也可以写成：

∑i=1n1(Xi−μ1)2/n1∑j=1n2(Yj−μ2)2/n2⋅Fα2(n2,n1) \frac{\sum_{i=1}^{n_1} (X_i - \mu_1)^2 / n_1}{\sum_{j=1}^{n_2} (Y_j - \mu_2)^2 / n_2} \cdot F_{\frac{\alpha}{2}}(n_2,n_1) ∑j=1n2(Yj−μ2)2/n2∑i=1n1(Xi−μ1)2/n1⋅F2α(n2,n1)

两种形式是等价的，只是写法不同。

3.3 P64 **两个正态总体方差比的置信区间（均值未知）**的完整推导过程

一、前提条件回顾

已知：

总体 X∼N(μ1,σ12)X \sim N(\mu_1, \sigma_1^2)X∼N(μ1,σ12)，总体 Y∼N(μ2,σ22)Y \sim N(\mu_2, \sigma_2^2)Y∼N(μ2,σ22)，且两总体相互独立；
均值 μ1,μ2\mu_1, \mu_2μ1,μ2 未知，方差 σ12,σ22\sigma_1^2, \sigma_2^2σ12,σ22 未知，我们要估计它们的比值 σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22；
X1,...,Xn1X_1,\dots,X_{n_1}X1,...,Xn1 是来自 XXX 的样本，样本方差 S12=1n1−1∑i=1n1(Xi−Xˉ)2S_1^2 = \frac{1}{n_1-1}\sum_{i=1}^{n_1}(X_i-\bar{X})^2S12=n1−11∑i=1n1(Xi−Xˉ)2；
Y1,...,Yn2Y_1,\dots,Y_{n_2}Y1,...,Yn2 是来自 YYY 的样本，样本方差 S22=1n2−1∑j=1n2(Yj−Yˉ)2S_2^2 = \frac{1}{n_2-1}\sum_{j=1}^{n_2}(Y_j-\bar{Y})^2S22=n2−11∑j=1n2(Yj−Yˉ)2；
置信水平为 1−α1-\alpha1−α。

二、第一步：构造卡方分布变量（关键：均值未知时自由度减1）

当均值未知时，我们需要用样本均值 Xˉ\bar{X}Xˉ 和 Yˉ\bar{Y}Yˉ 代替真实均值，此时：

对总体 XXX，有：

(n1−1)S12σ12∼χ2(n1−1) \frac{(n_1-1)S_1^2}{\sigma_1^2} \sim \chi^2(n_1-1) σ12(n1−1)S12∼χ2(n1−1)

自由度为 n1−1n_1-1n1−1，因为我们用样本均值估计了真实均值，损失了1个自由度。
同理，对总体 YYY，有：

(n2−1)S22σ22∼χ2(n2−1) \frac{(n_2-1)S_2^2}{\sigma_2^2} \sim \chi^2(n_2-1) σ22(n2−1)S22∼χ2(n2−1)

自由度为 n2−1n_2-1n2−1。

这两个卡方变量相互独立（因为两总体独立）。

三、第二步：构造F分布枢轴量

F分布的定义是：若 U∼χ2(m)U \sim \chi^2(m)U∼χ2(m)，V∼χ2(n)V \sim \chi^2(n)V∼χ2(n)，且 UUU 与 VVV 独立，则

F=U/mV/n∼F(m,n) F = \frac{U/m}{V/n} \sim F(m,n) F=V/nU/m∼F(m,n)

我们把上面的两个卡方变量代入这个定义：

U=(n1−1)S12σ12U = \frac{(n_1-1)S_1^2}{\sigma_1^2}U=σ12(n1−1)S12，自由度 m=n1−1m=n_1-1m=n1−1
V=(n2−1)S22σ22V = \frac{(n_2-1)S_2^2}{\sigma_2^2}V=σ22(n2−1)S22，自由度 n=n2−1n=n_2-1n=n2−1

于是得到枢轴量：

F=U/mV/n=((n1−1)S12σ12)/(n1−1)((n2−1)S22σ22)/(n2−1) F = \frac{U/m}{V/n} = \frac{\left( \frac{(n_1-1)S_1^2}{\sigma_1^2} \right) / (n_1-1)}{\left( \frac{(n_2-1)S_2^2}{\sigma_2^2} \right) / (n_2-1)} F=V/nU/m=(σ22(n2−1)S22)/(n2−1)(σ12(n1−1)S12)/(n1−1)

化简分子分母：

F=S12/σ12S22/σ22=S12S22⋅σ22σ12∼F(n1−1,n2−1) F = \frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_2^2} = \frac{S_1^2}{S_2^2} \cdot \frac{\sigma_2^2}{\sigma_1^2} \sim F(n_1-1, n_2-1) F=S22/σ22S12/σ12=S22S12⋅σ12σ22∼F(n1−1,n2−1)

这个枢轴量只含待估参数 σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22，且分布已知，完全符合要求。

四、第三步：利用F分布分位数建立概率等式

F分布是右偏分布，我们取双侧分位数，使得中间的概率为 1−α1-\alpha1−α：

P{F1−α2(n1−1,n2−1)<F<Fα2(n1−1,n2−1)}=1−α P\left\{ F_{1-\frac{\alpha}{2}}(n_1-1,n_2-1) < F < F_{\frac{\alpha}{2}}(n_1-1,n_2-1) \right\} = 1-\alpha P{F1−2α(n1−1,n2−1)<F<F2α(n1−1,n2−1)}=1−α

其中：

Fα2(n1−1,n2−1)F_{\frac{\alpha}{2}}(n_1-1,n_2-1)F2α(n1−1,n2−1)：上侧 α/2\alpha/2α/2 分位数（右侧面积为 α/2\alpha/2α/2）；
F1−α2(n1−1,n2−1)F_{1-\frac{\alpha}{2}}(n_1-1,n_2-1)F1−2α(n1−1,n2−1)：上侧 1−α/21-\alpha/21−α/2 分位数（右侧面积为 1−α/21-\alpha/21−α/2，即左侧面积为 α/2\alpha/2α/2）。

把 FFF 的表达式代入不等式：

P{F1−α2(n1−1,n2−1)<S12S22⋅σ22σ12<Fα2(n1−1,n2−1)}=1−α P\left\{ F_{1-\frac{\alpha}{2}}(n_1-1,n_2-1) < \frac{S_1^2}{S_2^2} \cdot \frac{\sigma_2^2}{\sigma_1^2} < F_{\frac{\alpha}{2}}(n_1-1,n_2-1) \right\} = 1-\alpha P{F1−2α(n1−1,n2−1)<S22S12⋅σ12σ22<F2α(n1−1,n2−1)}=1−α

五、第四步：解不等式，得到 σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22 的置信区间

我们的目标是把 σ12/σ22\sigma_1^2/\sigma_2^2σ12/σ22 单独放在中间，对不等式进行变形。

先把常数项移到两边：

令 A=S12S22A = \frac{S_1^2}{S_2^2}A=S22S12，则不等式变为：

F1−α2<A⋅σ22σ12<Fα2 F_{1-\frac{\alpha}{2}} < A \cdot \frac{\sigma_2^2}{\sigma_1^2} < F_{\frac{\alpha}{2}} F1−2α<A⋅σ12σ22<F2α
对不等式取倒数（注意不等号方向反转）：

1Fα2<1A⋅σ12σ22<1F1−α2 \frac{1}{F_{\frac{\alpha}{2}}} < \frac{1}{A} \cdot \frac{\sigma_1^2}{\sigma_2^2} < \frac{1}{F_{1-\frac{\alpha}{2}}} F2α1<A1⋅σ22σ12<F1−2α1
两边同时乘以 AAA（正数，不等号方向不变）：

AFα2<σ12σ22<AF1−α2 \frac{A}{F_{\frac{\alpha}{2}}} < \frac{\sigma_1^2}{\sigma_2^2} < \frac{A}{F_{1-\frac{\alpha}{2}}} F2αA<σ22σ12<F1−2αA
把 A=S12S22A = \frac{S_1^2}{S_2^2}A=S22S12 代回原式，就得到了置信区间：

(S12S22Fα2(n1−1,n2−1),S12S22F1−α2(n1−1,n2−1)) \boxed{ \left( \frac{S_1^2}{S_2^2 F_{\frac{\alpha}{2}}(n_1-1,n_2-1)}, \frac{S_1^2}{S_2^2 F_{1-\frac{\alpha}{2}}(n_1-1,n_2-1)} \right) } (S22F2α(n1−1,n2−1)S12,S22F1−2α(n1−1,n2−1)S12)

补充：F分布分位数的常用性质

这里有一个关键性质：F1−α2(n1−1,n2−1)=1Fα2(n2−1,n1−1)F_{1-\frac{\alpha}{2}}(n_1-1,n_2-1) = \frac{1}{F_{\frac{\alpha}{2}}(n_2-1,n_1-1)}F1−2α(n1−1,n2−1)=F2α(n2−1,n1−1)1，因此置信区间的右端点也可以写成：

S12S22⋅Fα2(n2−1,n1−1) \frac{S_1^2}{S_2^2} \cdot F_{\frac{\alpha}{2}}(n_2-1,n_1-1) S22S12⋅F2α(n2−1,n1−1)

两种形式是等价的，只是写法不同，用这个性质计算时会更方便。

3.3 P80 **「单侧置信限」和「双侧置信区间」**的区别

一、先搞懂：置信区间的本质是"概率覆盖"

不管单侧还是双侧，置信区间的核心都是：

我们找一个区间/边界，让"真实参数落在这个范围内"的概率等于置信水平 1−α1-\alpha1−α。

双侧置信区间：我们关心的是"参数大概在哪个中间范围"，比如"均值在 $14, 16$ 之间"。
单侧置信限：我们只关心一个方向，比如"寿命至少不低于多少？"（下限）或者"方差最多不超过多少？"（上限），不关心另一边。

二、为什么单侧不能直接用双侧的结论？

你说的"单侧上限不是双侧的下限吗？"，其实是混淆了分位数的定义 和不等式的方向，我们一步步拆解。

1. 先回顾双侧置信区间的逻辑（以方差为例）

双侧置信区间的概率等式是：

P{χ1−α22(n−1)<(n−1)S2σ2<χα22(n−1)}=1−α P\left\{ \chi^2_{1-\frac{\alpha}{2}}(n-1) < \frac{(n-1)S^2}{\sigma^2} < \chi^2_{\frac{\alpha}{2}}(n-1) \right\} = 1-\alpha P{χ1−2α2(n−1)<σ2(n−1)S2<χ2α2(n−1)}=1−α

它把 α\alphaα 分成了两部分：

左边尾部：P{(n−1)S2σ2≤χ1−α22}=α2P\left\{ \frac{(n-1)S^2}{\sigma^2} \le \chi^2_{1-\frac{\alpha}{2}} \right\} = \frac{\alpha}{2}P{σ2(n−1)S2≤χ1−2α2}=2α
右边尾部：P{(n−1)S2σ2≥χα22}=α2P\left\{ \frac{(n-1)S^2}{\sigma^2} \ge \chi^2_{\frac{\alpha}{2}} \right\} = \frac{\alpha}{2}P{σ2(n−1)S2≥χ2α2}=2α

变形后得到的双侧区间是：

((n−1)S2χα22, (n−1)S2χ1−α22) \left( \frac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}},\ \frac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}} \right) (χ2α2(n−1)S2, χ1−2α2(n−1)S2)

这里的两个端点，分别对应卡方分布的两个分位数。

2. 再看单侧置信上限的逻辑（题目第二问）

单侧置信上限，我们只要求：

P{σ2≤上限}=1−α P\left\{ \sigma^2 \le \text{上限} \right\} = 1-\alpha P{σ2≤上限}=1−α

也就是"方差小于等于这个上限的概率是 1−α1-\alpha1−α"，对应的尾部概率只在卡方分布的左侧。

第一步：从枢轴量出发

我们还是用同一个枢轴量：

χ2=(n−1)S2σ2∼χ2(n−1) \chi^2 = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) χ2=σ2(n−1)S2∼χ2(n−1)

第二步：只控制一侧的尾部

我们要让"σ2\sigma^2σ2 小于某个值"的概率是 1−α1-\alpha1−α，等价于：

P{(n−1)S2σ2≥χ1−α2(n−1)}=1−α P\left\{ \frac{(n-1)S^2}{\sigma^2} \ge \chi^2_{1-\alpha}(n-1) \right\} = 1-\alpha P{σ2(n−1)S2≥χ1−α2(n−1)}=1−α

这里的 χ1−α2(n−1)\chi^2_{1-\alpha}(n-1)χ1−α2(n−1) 是卡方分布的下侧分位数：

它的定义是：P{χ2≥χ1−α2}=1−αP\left\{ \chi^2 \ge \chi^2_{1-\alpha} \right\} = 1-\alphaP{χ2≥χ1−α2}=1−α
也就是"卡方变量大于这个分位数的概率是 1−α1-\alpha1−α"，剩下的左侧尾部概率是 α\alphaα。

第三步：变形不等式，得到上限

把枢轴量代入，解出 σ2\sigma^2σ2：

(n−1)S2σ2≥χ1−α2 \frac{(n-1)S^2}{\sigma^2} \ge \chi^2_{1-\alpha} σ2(n−1)S2≥χ1−α2

两边同时乘以 σ2\sigma^2σ2，再除以 χ1−α2\chi^2_{1-\alpha}χ1−α2（都是正数，不等号方向不变）：

σ2≤(n−1)S2χ1−α2 \sigma^2 \le \frac{(n-1)S^2}{\chi^2_{1-\alpha}} σ2≤χ1−α2(n−1)S2

所以单侧置信上限就是 (n−1)S2χ1−α2\frac{(n-1)S^2}{\chi^2_{1-\alpha}}χ1−α2(n−1)S2。

3. 为什么单侧上限≠双侧的下限？

我们对比一下：

双侧置信区间的左端点 ：(n−1)S2χα22\frac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}}χ2α2(n−1)S2
单侧置信上限：(n−1)S2χ1−α2\frac{(n-1)S^2}{\chi^2_{1-\alpha}}χ1−α2(n−1)S2

这两个用的分位数完全不一样：

双侧用的是 χα22\chi^2_{\frac{\alpha}{2}}χ2α2（上侧 α/2\alpha/2α/2 分位数，右侧尾部概率 α/2\alpha/2α/2）
单侧用的是 χ1−α2\chi^2_{1-\alpha}χ1−α2（下侧 1−α1-\alpha1−α 分位数，左侧尾部概率 α\alphaα）

举个例子，题目里 α=0.1\alpha=0.1α=0.1，n−1=5n-1=5n−1=5：

双侧的分位数：χ0.052(5)=11.070\chi^2_{0.05}(5)=11.070χ0.052(5)=11.070，χ0.952(5)=1.145\chi^2_{0.95}(5)=1.145χ0.952(5)=1.145
单侧的分位数：χ0.92(5)=1.610\chi^2_{0.9}(5)=1.610χ0.92(5)=1.610

可以看到，χ0.92(5)≠χ0.052(5)\chi^2_{0.9}(5) \neq \chi^2_{0.05}(5)χ0.92(5)=χ0.052(5)，所以单侧上限和双侧下限的数值也不一样，不能直接混用。

三、再用"单侧置信下限"帮你理解

如果我们要找方差的单侧置信下限，逻辑是类似的：

P{σ2≥下限}=1−α P\left\{ \sigma^2 \ge \text{下限} \right\} = 1-\alpha P{σ2≥下限}=1−α

对应的枢轴量概率等式是：

P{(n−1)S2σ2≤χα2(n−1)}=1−α P\left\{ \frac{(n-1)S^2}{\sigma^2} \le \chi^2_{\alpha}(n-1) \right\} = 1-\alpha P{σ2(n−1)S2≤χα2(n−1)}=1−α

变形后得到：

σ2≥(n−1)S2χα2 \sigma^2 \ge \frac{(n-1)S^2}{\chi^2_{\alpha}} σ2≥χα2(n−1)S2

这里用的是上侧 α\alphaα 分位数 χα2\chi^2_{\alpha}χα2，和双侧的 χα/22\chi^2_{\alpha/2}χα/22 也不一样。

四、一句话总结核心区别

类型	我们关心的概率	控制的尾部	使用的分位数	公式形式
双侧置信区间	P(L<σ2<U)=1−αP(L<\sigma^2<U)=1-\alphaP(L<σ2<U)=1−α	左右各 α/2\alpha/2α/2	χα/22\chi^2_{\alpha/2}χα/22 和 χ1−α/22\chi^2_{1-\alpha/2}χ1−α/22	两个端点
单侧置信上限	P(σ2≤U)=1−αP(\sigma^2 \le U)=1-\alphaP(σ2≤U)=1−α	左侧 α\alphaα	χ1−α2\chi^2_{1-\alpha}χ1−α2	一个上限
单侧置信下限	P(σ2≥L)=1−αP(\sigma^2 \ge L)=1-\alphaP(σ2≥L)=1−α	右侧 α\alphaα	χα2\chi^2_{\alpha}χα2	一个下限

关键：单侧只控制一个方向的尾部概率，所以只用一个分位数；双侧控制两个方向的尾部，所以用两个分位数，不能直接混用。