【TJU】研究生应用统计学课程笔记（6）——第二章参数估计（2.4 区间估计）

【TJU】研究生应用统计学课程笔记（6）------第二章参数估计（2.4 区间估计）

[2.4 区间估计](#2.4 区间估计)
- [2.4.1 区间估计与置信区间](#2.4.1 区间估计与置信区间)
- - [1️⃣ 区间估计的定义](#1️⃣ 区间估计的定义)
  - [2️⃣ 置信区间及其特性](#2️⃣ 置信区间及其特性)
  - [3️⃣ 寻求置信区间的方法](#3️⃣ 寻求置信区间的方法)
- [2.4.2 正态总体均值与方差的区间估计](#2.4.2 正态总体均值与方差的区间估计)
- - [1️⃣ 单个正态总体的情况](#1️⃣ 单个正态总体的情况)
  - [2️⃣ 两个正态总体的情况](#2️⃣ 两个正态总体的情况)
  - [3️⃣ 单侧置信区间](#3️⃣ 单侧置信区间)

2.4 区间估计

2.4.1 区间估计与置信区间

1️⃣ 区间估计的定义

定义：为了估计总体 X X X 的未知参数 θ \theta θ，通过样本寻求一个区间，并且给出此区间包含参数 θ \theta θ 真值的可信程度。这就是总体未知参数的区间估计问题。

示例：估计你的年龄八成可能性在 20 -- 30 岁之间

你的年龄 → \rightarrow → 被估参数；八成可能性 → \rightarrow → 可信度；20 -- 30 岁之间 → \rightarrow → 范围、区间；

评价标准：可信度：越大越好；区间：越小越好。

区间估计的目的 ：找出未知参数 θ \theta θ 的一个变化范围 θ ‾ ≤ θ ≤ θ ‾ \underline{\theta} \le \theta \le \overline{\theta} θ≤θ≤θ，使得该范围包含 θ \theta θ 的真值的概率为 1 − α 1 - \alpha 1−α。在区间估计理论中，被广泛接受的一种观点是置信区间，它是由奈曼 (Neymann) 于 1934 年提出的。

2️⃣ 置信区间及其特性

定义：设总体 X X X 的分布函数为 F ( x ; θ ) F(x; \theta) F(x;θ)， θ \theta θ 为未知参数， ( X 1 , X 2 , ... , X n ) (X_1, X_2, \dots, X_n) (X1,X2,...,Xn) 是取自总体的样本。设 α \alpha α 满足 0 < α < 1 0 < \alpha < 1 0<α<1， θ ‾ = θ ‾ ( X 1 , X 2 , ... , X n ) \underline{\theta} = \underline{\theta}(X_1, X_2, \dots, X_n) θ=θ(X1,X2,...,Xn)， θ ‾ = θ ‾ ( X 1 , X 2 , ... , X n ) \overline{\theta} = \overline{\theta}(X_1, X_2, \dots, X_n) θ=θ(X1,X2,...,Xn) 是两个统计量。若满足： P { θ ‾ ≤ θ ≤ θ ‾ } = 1 − α P \{ \underline{\theta} \le \theta \le \overline{\theta} \} = 1 - \alpha P{θ≤θ≤θ}=1−α

则称随机区间 [ θ ‾ , θ ‾ ] [\underline{\theta}, \overline{\theta}] [θ,θ] 为 θ \theta θ 的置信水平为 1 − α 1 - \alpha 1−α 的置信区间。这种估计 θ \theta θ 的方法叫做区间估计。

( 1 − α ) (1 - \alpha) (1−α)：称为置信水平 (置信度)。
θ ‾ \underline{\theta} θ 与 θ ‾ \overline{\theta} θ：分别称为双侧置信下限与双侧置信上限。

置信区间的特性：

1）随机性 ：被估计的参数 θ \theta θ 虽然未知，但它是一个常数，没有随机性，而区间 [ θ ‾ , θ ‾ ] [\underline{\theta}, \overline{\theta}] [θ,θ] 是随机的。随机区间 [ θ ‾ , θ ‾ ] [\underline{\theta}, \overline{\theta}] [θ,θ] 以 1 − α 1-\alpha 1−α 的概率包含着参数 θ \theta θ 的真值，而不能说参数 θ \theta θ 以 1 − α 1-\alpha 1−α 的概率落入随机区间 [ θ ‾ , θ ‾ ] [\underline{\theta}, \overline{\theta}] [θ,θ]。

2） P { θ ‾ ( X 1 , X 2 , ⋯ , X n ) ≤ θ ≤ θ ‾ ( X 1 , X 2 , ⋯ , X n ) } = 1 − α P\{\underline{\theta}(X_1, X_2, \cdots, X_n) \le \theta \le \overline{\theta}(X_1, X_2, \cdots, X_n)\} = 1 - \alpha P{θ(X1,X2,⋯,Xn)≤θ≤θ(X1,X2,⋯,Xn)}=1−α 的含义：若反复抽样多次 (各次得到的样本容量相等，都是 n n n)，每个样本值确定一个区间 [ θ ‾ , θ ‾ ] [\underline{\theta}, \overline{\theta}] [θ,θ]，每个这样的区间或包含 θ \theta θ 的真值，或不包含 θ \theta θ 的真值。按伯努利大数定理，在这样多的区间中，包含 θ \theta θ 真值的约占 1 − α 1 - \alpha 1−α，不包含的约占 α \alpha α。

置信区间定义的说明：

(1) 精度：置信区间的长度 θ ‾ − θ ‾ \overline{\theta} - \underline{\theta} θ−θ 越小越好。
(2) 置信度：置信区间包含参数的概率 P { θ ‾ ≤ θ ≤ θ ‾ } = 1 − α P \{ \underline{\theta} \le \theta \le \overline{\theta} \} = 1 - \alpha P{θ≤θ≤θ}=1−α 越大越好。

权衡关系： θ ‾ − θ ‾ \overline{\theta} - \underline{\theta} θ−θ 大， 1 − α 1 - \alpha 1−α 大，但参数 θ \theta θ 的不确定性大； θ ‾ − θ ‾ \overline{\theta} - \underline{\theta} θ−θ 小， 1 − α 1 - \alpha 1−α 小，但对参数 θ \theta θ 的确定具有较高的精度。

核心矛盾：置信度与估计精度是一对矛盾。

一般准则：在保证置信度的条件下，尽可能提高精度。

3️⃣ 寻求置信区间的方法

寻求置信区间的步骤：

(1) 从未知参数 θ \theta θ 的某个点估计 θ ^ ( θ ^ = θ ^ ( X 1 , ... , X n ) ) \hat{\theta} (\hat{\theta} = \hat{\theta}(X_1, \dots, X_n)) θ^(θ^=θ^(X1,...,Xn)) 出发，构造 θ ^ \hat{\theta} θ^ 与 θ \theta θ 的一个函数 W ( θ , θ ^ ) W(\theta, \hat{\theta}) W(θ,θ^)，使得 W W W 的分布已知，且不依赖于未知参数 θ \theta θ。
(2) 适当选取两个常数 a , b a, b a,b，使对给定的 1 − α 1-\alpha 1−α，有 P { a ≤ W ( θ , θ ^ ) ≤ b } = 1 − α . P\{a \le W(\theta, \hat{\theta}) \le b\} = 1 - \alpha. P{a≤W(θ,θ^)≤b}=1−α.
(3) 利用不等式运算，将不等式 a ≤ W ( θ ^ , θ ) ≤ b a \le W(\hat{\theta}, \theta) \le b a≤W(θ^,θ)≤b 等价变形为 θ ‾ ( X 1 , X 2 , ... , X n ) ≤ θ ≤ θ ‾ ( X 1 , X 2 , ... , X n ) \underline{\theta}(X_1, X_2, \dots, X_n) \le \theta \le \overline{\theta}(X_1, X_2, \dots, X_n) θ(X1,X2,...,Xn)≤θ≤θ(X1,X2,...,Xn)得 P { a ≤ W ( θ ^ , θ ) ≤ b } = P { θ ‾ ( X 1 , X 2 , ... , X n ) ≤ θ ≤ θ ‾ ( X 1 , X 2 , ... , X n ) } = 1 − α . P\{a \le W(\hat{\theta}, \theta) \le b\} = P\{\underline{\theta}(X_1, X_2, \dots, X_n) \le \theta \le \overline{\theta}(X_1, X_2, \dots, X_n)\} = 1 - \alpha. P{a≤W(θ^,θ)≤b}=P{θ(X1,X2,...,Xn)≤θ≤θ(X1,X2,...,Xn)}=1−α.此时参数 θ \theta θ 的置信水平为 1 − α 1-\alpha 1−α 的置信区间为： [ θ ‾ , θ ‾ ] [\underline{\theta}, \overline{\theta}] [θ,θ]

题目：设 ( X 1 , X 2 , ⋯ , X n ) (X_1, X_2, \cdots, X_n) (X1,X2,⋯,Xn) 是来自均匀分布 U ( 0 , θ ) U(0, \theta) U(0,θ) 的一个样本，对给定的 α ( 0 < α < 1 ) \alpha (0 < \alpha < 1) α(0<α<1), 求 θ \theta θ 的置信水平为 1 − α 1 - \alpha 1−α 的置信区间。

解：由第一章相关知识可知， X ( n ) X_{(n)} X(n) 是 θ \theta θ 的极大似然估计量（此处标注：从点估计出发），其分布函数为： F X ( n ) ( x ) = P { X ( n ) ≤ x } = { ( x / θ ) n , 0 < x < θ 0 , 其他 F_{X_{(n)}}(x) = P\{X_{(n)} \le x\} = \begin{cases} (x/\theta)^n, & 0 < x < \theta \\ 0, & \text{其他} \end{cases} FX(n)(x)=P{X(n)≤x}={(x/θ)n,0,0<x<θ其他取 W ( X ( n ) ; θ ) = X ( n ) θ W(X_{(n)}; \theta) = \frac{X_{(n)}}{\theta} W(X(n);θ)=θX(n)（此处标注：构造函数W包含点估计及参数），其分布函数为： F W ( x ) = { x n , 0 < x < 1 0 , 其他 F_W(x) = \begin{cases} x^n, & 0 < x < 1 \\ 0, & \text{其他} \end{cases} FW(x)={xn,0,0<x<1其他（此处标注：函数W的分布已知且不依赖于参数）选取适当的区间，设（此处标注：选取适当的区间）： P { λ ≤ X ( n ) θ ≤ 1 } = 1 − α P \left\{ \lambda \le \frac{X_{(n)}}{\theta} \le 1 \right\} = 1 - \alpha P{λ≤θX(n)≤1}=1−α即： F W ( 1 ) − F W ( λ ) = 1 − α F_W(1) - F_W(\lambda) = 1 - \alpha FW(1)−FW(λ)=1−α解得： λ = α n \lambda = \sqrt[n]{\alpha} λ=nα （此处标注：解出区间的边界值）通过恒等变形得出包含参数的区间（此处标注：通过恒等变形得出包含参数的区间）： ∵ P { X ( n ) ≤ θ ≤ X ( n ) α n } = 1 − α \because P \left\{ X_{(n)} \le \theta \le \frac{X_{(n)}}{\sqrt[n]{\alpha}} \right\} = 1 - \alpha ∵P{X(n)≤θ≤nα X(n)}=1−α结论： θ \theta θ 的置信水平为 1 − α 1 - \alpha 1−α 的置信区间为： [ X ( n ) , X ( n ) α n ] \left[ X_{(n)}, \frac{X_{(n)}}{\sqrt[n]{\alpha}} \right] [X(n),nα X(n)]

2.4.2 正态总体均值与方差的区间估计

1️⃣ 单个正态总体的情况

例：设总体 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2)， ( X 1 , X 2 , ... , X n ) (X_1, X_2, \dots, X_n) (X1,X2,...,Xn) 是总体 X X X 的样本，求 μ , σ 2 \mu, \sigma^2 μ,σ2 的置信水平为 1 − α 1 - \alpha 1−α 的置信区间。

(a) σ \sigma σ 已知， μ \mu μ 的置信区间

解： X ˉ \bar{X} Xˉ 是 μ \mu μ 的无偏估计，且： Z = X ˉ − μ σ 2 / n ∼ N ( 0 , 1 ) Z = \frac{\bar{X} - \mu}{\sqrt{\sigma^2/n}} \sim N(0, 1) Z=σ2/n Xˉ−μ∼N(0,1)

对于给定的 α ( 0 < α < 1 ) \alpha (0 < \alpha < 1) α(0<α<1)，有 P { ∣ X ˉ − μ σ 2 / n ∣ ≤ u 1 − α 2 } = 1 − α P \left\{ \left| \frac{\bar{X} - \mu}{\sqrt{\sigma^2/n}} \right| \le u_{1-\frac{\alpha}{2}} \right\} = 1 - \alpha P{ σ2/n Xˉ−μ ≤u1−2α}=1−α ∴ P { X ˉ − σ 2 n ⋅ u 1 − α 2 ≤ μ ≤ X ˉ + σ 2 n ⋅ u 1 − α 2 } = 1 − α \therefore P \left\{ \bar{X} - \sqrt{\frac{\sigma^2}{n}} \cdot u_{1-\frac{\alpha}{2}} \le \mu \le \bar{X} + \sqrt{\frac{\sigma^2}{n}} \cdot u_{1-\frac{\alpha}{2}} \right\} = 1 - \alpha ∴P{Xˉ−nσ2 ⋅u1−2α≤μ≤Xˉ+nσ2 ⋅u1−2α}=1−α得 μ \mu μ 的置信水平为 1 − α 1 - \alpha 1−α 的置信区间为： [ X ˉ − σ n u 1 − α 2 , X ˉ + σ n u 1 − α 2 ] ( 1 ) \left[ \bar{X} - \frac{\sigma}{\sqrt{n}} u_{1-\frac{\alpha}{2}}, \bar{X} + \frac{\sigma}{\sqrt{n}} u_{1-\frac{\alpha}{2}} \right] \quad (1) [Xˉ−n σu1−2α,Xˉ+n σu1−2α](1)

一般准则：在保证置信度的条件下尽可能提高精度。即置信度不变的情况下，区间长度尽量短。

对称的选取：保证 1 − α 1 - \alpha 1−α 的置信度下区间长度最短。

(b) σ \sigma σ 未知， μ \mu μ 的置信区间

σ 2 \sigma^2 σ2 为未知，因为 S 2 S^2 S2 是 σ 2 \sigma^2 σ2 的无偏估计量，所以用 S S S 替换 σ \sigma σ： X ˉ − μ S / n ∼ t ( n − 1 ) \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n - 1) S/n Xˉ−μ∼t(n−1) P { ∣ X ˉ − μ S / n ∣ ≤ t 1 − α 2 ( n − 1 ) } = 1 − α P \left\{ \left| \frac{\bar{X} - \mu}{S/\sqrt{n}} \right| \le t_{1-\frac{\alpha}{2}}(n - 1) \right\} = 1 - \alpha P{ S/n Xˉ−μ ≤t1−2α(n−1)}=1−α

等价变换： P { X ˉ − t 1 − α 2 ( n − 1 ) S n ≤ μ ≤ X ˉ + t 1 − α 2 ( n − 1 ) S n } = 1 − α P \left\{ \bar{X} - t_{1-\frac{\alpha}{2}}(n - 1) \frac{S}{\sqrt{n}} \le \mu \le \bar{X} + t_{1-\frac{\alpha}{2}}(n - 1) \frac{S}{\sqrt{n}} \right\} = 1 - \alpha P{Xˉ−t1−2α(n−1)n S≤μ≤Xˉ+t1−2α(n−1)n S}=1−α求得 μ \mu μ 的置信水平为 ( 1 − α ) (1 - \alpha) (1−α) 的置信区间 ( σ 2 \sigma^2 σ2 未知)： [ X ˉ − t 1 − α 2 ( n − 1 ) S n , X ˉ + t 1 − α 2 ( n − 1 ) S n ] ( 2 ) \left[ \bar{X} - t_{1-\frac{\alpha}{2}}(n - 1) \frac{S}{\sqrt{n}}, \bar{X} + t_{1-\frac{\alpha}{2}}(n - 1) \frac{S}{\sqrt{n}} \right] \quad (2) [Xˉ−t1−2α(n−1)n S,Xˉ+t1−2α(n−1)n S](2)

(c) 方差 σ 2 \sigma^2 σ2 的置信区间 ( μ \mu μ 已知)

当均值 μ \mu μ 已知时，利用以下枢轴变量进行推导： ∑ i = 1 n ( X i − μ ) 2 σ 2 ∼ χ 2 ( n ) \frac{\sum_{i=1}^n (X_i - \mu)^2}{\sigma^2} \sim \chi^2(n) σ2∑i=1n(Xi−μ)2∼χ2(n)给定置信水平 1 − α 1 - \alpha 1−α： P { χ α 2 2 ( n ) ≤ ∑ i = 1 n ( X i − μ ) 2 σ 2 ≤ χ 1 − α 2 2 ( n ) } = 1 − α P \left\{ \chi_{\frac{\alpha}{2}}^2(n) \le \frac{\sum_{i=1}^n (X_i - \mu)^2}{\sigma^2} \le \chi_{1-\frac{\alpha}{2}}^2(n) \right\} = 1 - \alpha P{χ2α2(n)≤σ2∑i=1n(Xi−μ)2≤χ1−2α2(n)}=1−α

即 P { ∑ i = 1 n ( X i − μ ) 2 χ 1 − α 2 2 ( n ) ≤ σ 2 ≤ ∑ i = 1 n ( X i − μ ) 2 χ α 2 2 ( n ) } = 1 − α P \left\{ \frac{\sum_{i=1}^n (X_i - \mu)^2}{\chi_{1-\frac{\alpha}{2}}^2(n)} \le \sigma^2 \le \frac{\sum_{i=1}^n (X_i - \mu)^2}{\chi_{\frac{\alpha}{2}}^2(n)} \right\} = 1 - \alpha P{χ1−2α2(n)∑i=1n(Xi−μ)2≤σ2≤χ2α2(n)∑i=1n(Xi−μ)2}=1−α

得到方差 σ 2 \sigma^2 σ2 的一个置信水平为 1 − α 1 - \alpha 1−α 的置信区间： [ ∑ i = 1 n ( X i − μ ) 2 χ 1 − α 2 2 ( n ) , ∑ i = 1 n ( X i − μ ) 2 χ α 2 2 ( n ) ] ( 3 ) \left[ \frac{\sum_{i=1}^n (X_i - \mu)^2}{\chi_{1-\frac{\alpha}{2}}^2(n)}, \frac{\sum_{i=1}^n (X_i - \mu)^2}{\chi_{\frac{\alpha}{2}}^2(n)} \right] \quad (3) [χ1−2α2(n)∑i=1n(Xi−μ)2,χ2α2(n)∑i=1n(Xi−μ)2](3)标准差 σ \sigma σ 的一个置信水平为 1 − α 1 - \alpha 1−α 的置信区间： [ ∑ i = 1 n ( X i − μ ) 2 χ 1 − α 2 2 ( n ) , ∑ i = 1 n ( X i − μ ) 2 χ α 2 2 ( n ) ] \left[ \sqrt{\frac{\sum_{i=1}^n (X_i - \mu)^2}{\chi_{1-\frac{\alpha}{2}}^2(n)}}, \sqrt{\frac{\sum_{i=1}^n (X_i - \mu)^2}{\chi_{\frac{\alpha}{2}}^2(n)}} \right] [χ1−2α2(n)∑i=1n(Xi−μ)2 ,χ2α2(n)∑i=1n(Xi−μ)2 ]

(d) 方差 σ 2 \sigma^2 σ2 的置信区间 ( μ \mu μ 未知)

σ 2 \sigma^2 σ2 的无偏估计量为 S 2 S^2 S2，利用枢轴变量： ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{(n - 1)S^2}{\sigma^2} \sim \chi^2(n - 1) σ2(n−1)S2∼χ2(n−1)当 1 − α 1 - \alpha 1−α 给定时： P { χ α 2 2 ( n − 1 ) ≤ ( n − 1 ) S 2 σ 2 ≤ χ 1 − α 2 2 ( n − 1 ) } = 1 − α P \left\{ \chi_{\frac{\alpha}{2}}^2(n - 1) \le \frac{(n - 1)S^2}{\sigma^2} \le \chi_{1-\frac{\alpha}{2}}^2(n - 1) \right\} = 1 - \alpha P{χ2α2(n−1)≤σ2(n−1)S2≤χ1−2α2(n−1)}=1−α即： P { ( n − 1 ) S 2 χ 1 − α 2 2 ( n − 1 ) ≤ σ 2 ≤ ( n − 1 ) S 2 χ α 2 2 ( n − 1 ) } = 1 − α P \left\{ \frac{(n - 1)S^2}{\chi_{1-\frac{\alpha}{2}}^2(n - 1)} \le \sigma^2 \le \frac{(n - 1)S^2}{\chi_{\frac{\alpha}{2}}^2(n - 1)} \right\} = 1 - \alpha P{χ1−2α2(n−1)(n−1)S2≤σ2≤χ2α2(n−1)(n−1)S2}=1−α

得到方差 σ 2 \sigma^2 σ2 的一个置信水平为 1 − α 1 - \alpha 1−α 的置信区间： [ ( n − 1 ) S 2 χ 1 − α 2 2 ( n − 1 ) , ( n − 1 ) S 2 χ α 2 2 ( n − 1 ) ] ( 4 ) \left[ \frac{(n-1)S^2}{\chi_{1-\frac{\alpha}{2}}^2(n-1)}, \frac{(n-1)S^2}{\chi_{\frac{\alpha}{2}}^2(n-1)} \right] \quad (4) [χ1−2α2(n−1)(n−1)S2,χ2α2(n−1)(n−1)S2](4)

标准差 σ \sigma σ 的一个置信水平为 1 − α 1 - \alpha 1−α 的置信区间： [ ( n − 1 ) S 2 χ 1 − α 2 2 ( n − 1 ) , ( n − 1 ) S 2 χ α 2 2 ( n − 1 ) ] \left[ \sqrt{\frac{(n-1)S^2}{\chi_{1-\frac{\alpha}{2}}^2(n-1)}}, \sqrt{\frac{(n-1)S^2}{\chi_{\frac{\alpha}{2}}^2(n-1)}} \right] [χ1−2α2(n−1)(n−1)S2 ,χ2α2(n−1)(n−1)S2 ]

2️⃣ 两个正态总体的情况

设总体 X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) X \sim N(\mu_1, \sigma_1^2), Y \sim N(\mu_2, \sigma_2^2) X∼N(μ1,σ12),Y∼N(μ2,σ22)， ( X 1 , X 2 , ... , X n 1 ) (X_1, X_2, \dots, X_{n1}) (X1,X2,...,Xn1) 是 X X X 的样本， ( Y 1 , Y 2 , ... , Y n 2 ) (Y_1, Y_2, \dots, Y_{n2}) (Y1,Y2,...,Yn2) 是 Y Y Y 的样本。这两个样本相互独立， X ˉ , Y ˉ , S 1 2 , S 2 2 \bar{X}, \bar{Y}, S_1^2, S_2^2 Xˉ,Yˉ,S12,S22 分别为第一、二个总体的样本均值与样本方差。

(1) 两个总体均值差 μ 1 − μ 2 \mu_1 - \mu_2 μ1−μ2 的置信区间 (置信度为 1 − α 1 - \alpha 1−α)

(a) σ 1 2 , σ 2 2 \sigma_1^2, \sigma_2^2 σ12,σ22 均为已知：

因 X ˉ − Y ˉ \bar{X} - \bar{Y} Xˉ−Yˉ 为 μ 1 − μ 2 \mu_1 - \mu_2 μ1−μ2 的无偏估计量，而 X ˉ − Y ˉ ∼ N ( μ 1 − μ 2 , σ 1 2 n 1 + σ 2 2 n 2 ) \bar{X} - \bar{Y} \sim N\left( \mu_1 - \mu_2, \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} \right) Xˉ−Yˉ∼N(μ1−μ2,n1σ12+n2σ22) ( X ˉ − Y ˉ ) − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) \frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0, 1) n1σ12+n2σ22 (Xˉ−Yˉ)−(μ1−μ2)∼N(0,1)

即得 μ 1 − μ 2 \mu_1 - \mu_2 μ1−μ2 的 ( 1 − α ) (1 - \alpha) (1−α) 置信区间： [ ( X ˉ − Y ˉ ) ± u 1 − α 2 σ 1 2 n 1 + σ 2 2 n 2 ] ( 5 ) \left[ (\bar{X} - \bar{Y}) \pm u_{1-\frac{\alpha}{2}} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}} \right] \quad (5) (Xˉ−Yˉ)±u1−2αn1σ12+n2σ22 (5)

(b) σ 1 2 = σ 2 2 = σ 2 \sigma_1^2 = \sigma_2^2 = \sigma^2 σ12=σ22=σ2，但 σ 2 \sigma^2 σ2 为未知：

由第一章定理知： ( X ˉ − Y ˉ ) − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 ∼ t n 1 + n 2 − 2 \frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t_{n_1 + n_2 - 2} Swn11+n21 (Xˉ−Yˉ)−(μ1−μ2)∼tn1+n2−2

此处： S w 2 = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 , S w = S w 2 S_w^2 = \frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2}, \quad S_w = \sqrt{S_w^2} Sw2=n1+n2−2(n1−1)S12+(n2−1)S22,Sw=Sw2

从而可得 μ 1 − μ 2 \mu_1 - \mu_2 μ1−μ2 的一个置信度为 1 − α 1 - \alpha 1−α 的置信区间为： [ ( X ˉ − Y ˉ ) ± S w ⋅ t 1 − α 2 ( n 1 + n 2 − 2 ) 1 n 1 + 1 n 2 ] ( 6 ) \left[ (\bar{X} - \bar{Y}) \pm S_w \cdot t_{1-\frac{\alpha}{2}}(n_1 + n_2 - 2) \sqrt{\frac{1}{n_1} + \frac{1}{n_2}} \right] \quad (6) [(Xˉ−Yˉ)±Sw⋅t1−2α(n1+n2−2)n11+n21 ](6)

(2) 两个总体方差比 σ 1 2 / σ 2 2 \sigma_1^2 / \sigma_2^2 σ12/σ22 的置信区间 ( μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2 为未知)

由第一章定理知： S 1 2 / S 2 2 σ 1 2 / σ 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) \frac{S_1^2 / S_2^2}{\sigma_1^2 / \sigma_2^2} \sim F(n_1 - 1, n_2 - 1) σ12/σ22S12/S22∼F(n1−1,n2−1) P { F α 2 ( n 1 − 1 , n 2 − 1 ) ≤ S 1 2 / S 2 2 σ 1 2 / σ 2 2 ≤ F 1 − α 2 ( n 1 − 1 , n 2 − 1 ) } = 1 − α P \left\{ F_{\frac{\alpha}{2}}(n_1 - 1, n_2 - 1) \le \frac{S_1^2 / S_2^2}{\sigma_1^2 / \sigma_2^2} \le F_{1-\frac{\alpha}{2}}(n_1 - 1, n_2 - 1) \right\} = 1 - \alpha P{F2α(n1−1,n2−1)≤σ12/σ22S12/S22≤F1−2α(n1−1,n2−1)}=1−α即： P { 1 F 1 − α 2 ( n 1 − 1 , n 2 − 1 ) S 1 2 S 2 2 ≤ σ 1 2 σ 2 2 ≤ 1 F α 2 ( n 1 − 1 , n 2 − 1 ) S 1 2 S 2 2 } = 1 − α P \left\{ \frac{1}{F_{1-\frac{\alpha}{2}}(n_1 - 1, n_2 - 1)} \frac{S_1^2}{S_2^2} \le \frac{\sigma_1^2}{\sigma_2^2} \le \frac{1}{F_{\frac{\alpha}{2}}(n_1 - 1, n_2 - 1)} \frac{S_1^2}{S_2^2} \right\} = 1 - \alpha P{F1−2α(n1−1,n2−1)1S22S12≤σ22σ12≤F2α(n1−1,n2−1)1S22S12}=1−α于是得 σ 1 2 / σ 2 2 \sigma_1^2 / \sigma_2^2 σ12/σ22 的一个置信度为 1 − α 1 - \alpha 1−α 的置信区间为： [ S 1 2 S 2 2 F α 2 ( n 2 − 1 , n 1 − 1 ) , S 1 2 S 2 2 F 1 − α 2 ( n 2 − 1 , n 1 − 1 ) ] ( 7 ) \left[ \frac{S_1^2}{S_2^2} F_{\frac{\alpha}{2}}(n_2 - 1, n_1 - 1), \quad \frac{S_1^2}{S_2^2} F_{1-\frac{\alpha}{2}}(n_2 - 1, n_1 - 1) \right] \quad (7) [S22S12F2α(n2−1,n1−1),S22S12F1−2α(n2−1,n1−1)](7)

注：这里利用了 F F F 分布的性质： F 1 − α ( d 1 , d 2 ) = 1 F α ( d 2 , d 1 ) F_{1-\alpha}(d_1, d_2) = \frac{1}{F_{\alpha}(d_2, d_1)} F1−α(d1,d2)=Fα(d2,d1)1。

3️⃣ 单侧置信区间

定义： 对于给定值 α \alpha α ( 0 < α < 1 0 < \alpha < 1 0<α<1)，若由样本 ( X 1 , X 2 , ... , X n ) (X_1, X_2, \dots, X_n) (X1,X2,...,Xn) 确定的统计量 θ ‾ = θ ‾ ( X 1 , X 2 , ... , X n ) \underline{\theta} = \underline{\theta}(X_1, X_2, \dots, X_n) θ=θ(X1,X2,...,Xn)，对任意 θ ∈ Θ \theta \in \Theta θ∈Θ 满足： P { θ > θ ‾ } = 1 − α P \{ \theta > \underline{\theta} \} = 1 - \alpha P{θ>θ}=1−α

则称随机区间 ( θ ‾ , + ∞ ) (\underline{\theta}, +\infty) (θ,+∞) 是 θ \theta θ 的置信水平为 1 − α 1 - \alpha 1−α 的单侧置信区间， θ ‾ \underline{\theta} θ 称为 θ \theta θ 的置信水平为 1 − α 1 - \alpha 1−α 的单侧置信下限。

又若统计量 θ ‾ = θ ‾ ( X 1 , X 2 , ... , X n ) \overline{\theta} = \overline{\theta}(X_1, X_2, \dots, X_n) θ=θ(X1,X2,...,Xn)，对任意 θ ∈ Θ \theta \in \Theta θ∈Θ 满足： P { θ < θ ‾ } = 1 − α P \{ \theta < \overline{\theta} \} = 1 - \alpha P{θ<θ}=1−α

则称随机区间 ( − ∞ , θ ‾ ) (-\infty, \overline{\theta}) (−∞,θ) 是 θ \theta θ 的置信水平为 1 − α 1 - \alpha 1−α 的单侧置信区间， θ ‾ \overline{\theta} θ 称为 θ \theta θ 的置信水平为 1 − α 1 - \alpha 1−α 的单侧置信上限。

例：求 μ \mu μ 的置信度为 1 − α 1-\alpha 1−α 的单侧置信区间

设 σ 2 \sigma^2 σ2 未知， ( X 1 , X 2 , ... , X n ) (X_1, X_2, \dots, X_n) (X1,X2,...,Xn) 是取自总体 X X X 的样本。由于： X ˉ − μ S / n ∼ t ( n − 1 ) \frac{\bar{X} - \mu}{S / \sqrt{n}} \sim t(n - 1) S/n Xˉ−μ∼t(n−1)

通过枢轴变量性质可得： P { X ˉ − μ S / n < t 1 − α ( n − 1 ) } = 1 − α P \left\{ \frac{\bar{X} - \mu}{S / \sqrt{n}} < t_{1-\alpha}(n - 1) \right\} = 1 - \alpha P{S/n Xˉ−μ<t1−α(n−1)}=1−α

即： P { μ > X ˉ − S n t 1 − α ( n − 1 ) } = 1 − α P \left\{ \mu > \bar{X} - \frac{S}{\sqrt{n}} t_{1-\alpha}(n - 1) \right\} = 1 - \alpha P{μ>Xˉ−n St1−α(n−1)}=1−α

于是得到 μ \mu μ 的一个置信度为 1 − α 1 - \alpha 1−α 的单侧置信区间： ( X ˉ − S n t 1 − α ( n − 1 ) , + ∞ ) \left( \bar{X} - \frac{S}{\sqrt{n}} t_{1-\alpha}(n - 1), +\infty \right) (Xˉ−n St1−α(n−1),+∞)
μ \mu μ 的置信度为 1 − α 1 - \alpha 1−α 的单侧置信下限为： X ˉ − S n t 1 − α ( n − 1 ) \bar{X} - \frac{S}{\sqrt{n}} t_{1-\alpha}(n - 1) Xˉ−n St1−α(n−1)

例 6：从一批灯泡中随机地取 5 只作寿命试验，测得寿命 (以小时计) 为：1050, 1100, 1120, 1250, 1280。设灯泡寿命服从正态分布，求灯泡寿命平均值 μ \mu μ 的置信度为 0.95 的单侧置信下限。

解： μ \mu μ 的置信度为 1 − α 1 - \alpha 1−α 的单侧置信下限公式为： x ˉ − s n t 1 − α ( n − 1 ) \bar{x} - \frac{s}{\sqrt{n}} t_{1-\alpha}(n - 1) xˉ−n st1−α(n−1)已知数据：样本均值： x ˉ = 1160 \bar{x} = 1160 xˉ=1160样本方差： s 2 = 9950 s^2 = 9950 s2=9950 (由此可得 s = 9950 ≈ 99.75 s = \sqrt{9950} \approx 99.75 s=9950 ≈99.75)

样本量： n = 5 n = 5 n=5置信水平： 1 − α = 0.95 1 - \alpha = 0.95 1−α=0.95

查表：自由度为 4 时， t 0.95 ( 4 ) = 2.1318 t_{0.95}(4) = 2.1318 t0.95(4)=2.1318

计算结果：代入公式计算，得所求单侧置信下限为 1065 小时。

【TJU】研究生应用统计学课程笔记（6）——第二章 参数估计（2.4 区间估计）

【TJU】研究生应用统计学课程笔记（6）------第二章 参数估计（2.4 区间估计）