【TJU】研究生应用统计学课程笔记(6)——第二章 参数估计(2.4 区间估计)

【TJU】研究生应用统计学课程笔记(6)------第二章 参数估计(2.4 区间估计)

  • [2.4 区间估计](#2.4 区间估计)
    • [2.4.1 区间估计与置信区间](#2.4.1 区间估计与置信区间)
      • [1️⃣ 区间估计的定义](#1️⃣ 区间估计的定义)
      • [2️⃣ 置信区间及其特性](#2️⃣ 置信区间及其特性)
      • [3️⃣ 寻求置信区间的方法](#3️⃣ 寻求置信区间的方法)
    • [2.4.2 正态总体均值与方差的区间估计](#2.4.2 正态总体均值与方差的区间估计)
      • [1️⃣ 单个正态总体的情况](#1️⃣ 单个正态总体的情况)
      • [2️⃣ 两个正态总体的情况](#2️⃣ 两个正态总体的情况)
      • [3️⃣ 单侧置信区间](#3️⃣ 单侧置信区间)

2.4 区间估计

2.4.1 区间估计与置信区间

1️⃣ 区间估计的定义

定义 :为了估计总体 X X X 的未知参数 θ \theta θ,通过样本寻求一个区间,并且给出此区间包含参数 θ \theta θ 真值的可信程度。这就是总体未知参数的区间估计问题。

示例:估计你的年龄 八成可能性 在 20 -- 30 岁之间

你的年龄 → \rightarrow → 被估参数;八成可能性 → \rightarrow → 可信度;20 -- 30 岁之间 → \rightarrow → 范围、区间;

评价标准:可信度: 越大越好;区间: 越小越好。

区间估计的目的 :找出未知参数 θ \theta θ 的一个变化范围 θ ‾ ≤ θ ≤ θ ‾ \underline{\theta} \le \theta \le \overline{\theta} θ≤θ≤θ,使得该范围包含 θ \theta θ 的真值的概率为 1 − α 1 - \alpha 1−α。在区间估计理论中,被广泛接受的一种观点是置信区间,它是由奈曼 (Neymann) 于 1934 年提出的。

2️⃣ 置信区间及其特性

定义 : 设总体 X X X 的分布函数为 F ( x ; θ ) F(x; \theta) F(x;θ), θ \theta θ 为未知参数, ( X 1 , X 2 , ... , X n ) (X_1, X_2, \dots, X_n) (X1,X2,...,Xn) 是取自总体的样本。设 α \alpha α 满足 0 < α < 1 0 < \alpha < 1 0<α<1, θ ‾ = θ ‾ ( X 1 , X 2 , ... , X n ) \underline{\theta} = \underline{\theta}(X_1, X_2, \dots, X_n) θ=θ(X1,X2,...,Xn), θ ‾ = θ ‾ ( X 1 , X 2 , ... , X n ) \overline{\theta} = \overline{\theta}(X_1, X_2, \dots, X_n) θ=θ(X1,X2,...,Xn) 是两个统计量。若满足: P { θ ‾ ≤ θ ≤ θ ‾ } = 1 − α P \{ \underline{\theta} \le \theta \le \overline{\theta} \} = 1 - \alpha P{θ≤θ≤θ}=1−α

则称随机区间 [ θ ‾ , θ ‾ ] [\underline{\theta}, \overline{\theta}] [θ,θ] 为 θ \theta θ 的置信水平为 1 − α 1 - \alpha 1−α 的置信区间。这种估计 θ \theta θ 的方法叫做区间估计。

  • ( 1 − α ) (1 - \alpha) (1−α):称为置信水平 (置信度)。

  • θ ‾ \underline{\theta} θ 与 θ ‾ \overline{\theta} θ:分别称为双侧置信下限与双侧置信上限。

置信区间的特性

1)随机性 :被估计的参数 θ \theta θ 虽然未知,但它是一个常数,没有随机性,而区间 [ θ ‾ , θ ‾ ] [\underline{\theta}, \overline{\theta}] [θ,θ] 是随机的。随机区间 [ θ ‾ , θ ‾ ] [\underline{\theta}, \overline{\theta}] [θ,θ] 以 1 − α 1-\alpha 1−α 的概率包含着参数 θ \theta θ 的真值,而不能说参数 θ \theta θ 以 1 − α 1-\alpha 1−α 的概率落入随机区间 [ θ ‾ , θ ‾ ] [\underline{\theta}, \overline{\theta}] [θ,θ]。

2) P { θ ‾ ( X 1 , X 2 , ⋯   , X n ) ≤ θ ≤ θ ‾ ( X 1 , X 2 , ⋯   , X n ) } = 1 − α P\{\underline{\theta}(X_1, X_2, \cdots, X_n) \le \theta \le \overline{\theta}(X_1, X_2, \cdots, X_n)\} = 1 - \alpha P{θ(X1,X2,⋯,Xn)≤θ≤θ(X1,X2,⋯,Xn)}=1−α 的含义 :若反复抽样多次 (各次得到的样本容量相等,都是 n n n),每个样本值确定一个区间 [ θ ‾ , θ ‾ ] [\underline{\theta}, \overline{\theta}] [θ,θ],每个这样的区间或包含 θ \theta θ 的真值,或不包含 θ \theta θ 的真值。按伯努利大数定理,在这样多的区间中,包含 θ \theta θ 真值的约占 1 − α 1 - \alpha 1−α,不包含的约占 α \alpha α。

置信区间定义的说明

  • (1) 精度: 置信区间的长度 θ ‾ − θ ‾ \overline{\theta} - \underline{\theta} θ−θ 越小越好。
  • (2) 置信度: 置信区间包含参数的概率 P { θ ‾ ≤ θ ≤ θ ‾ } = 1 − α P \{ \underline{\theta} \le \theta \le \overline{\theta} \} = 1 - \alpha P{θ≤θ≤θ}=1−α 越大越好。

权衡关系: θ ‾ − θ ‾ \overline{\theta} - \underline{\theta} θ−θ 大, 1 − α 1 - \alpha 1−α 大,但参数 θ \theta θ 的不确定性大; θ ‾ − θ ‾ \overline{\theta} - \underline{\theta} θ−θ 小, 1 − α 1 - \alpha 1−α 小,但对参数 θ \theta θ 的确定具有较高的精度。

核心矛盾: 置信度与估计精度是一对矛盾。

一般准则: 在保证置信度的条件下,尽可能提高精度。

3️⃣ 寻求置信区间的方法

寻求置信区间的步骤

  • (1) 从未知参数 θ \theta θ 的某个点估计 θ ^ ( θ ^ = θ ^ ( X 1 , ... , X n ) ) \hat{\theta} (\hat{\theta} = \hat{\theta}(X_1, \dots, X_n)) θ^(θ^=θ^(X1,...,Xn)) 出发,构造 θ ^ \hat{\theta} θ^ 与 θ \theta θ 的一个函数 W ( θ , θ ^ ) W(\theta, \hat{\theta}) W(θ,θ^),使得 W W W 的分布已知,且不依赖于未知参数 θ \theta θ。

  • (2) 适当选取两个常数 a , b a, b a,b,使对给定的 1 − α 1-\alpha 1−α,有 P { a ≤ W ( θ , θ ^ ) ≤ b } = 1 − α . P\{a \le W(\theta, \hat{\theta}) \le b\} = 1 - \alpha. P{a≤W(θ,θ^)≤b}=1−α.

  • (3) 利用不等式运算,将不等式 a ≤ W ( θ ^ , θ ) ≤ b a \le W(\hat{\theta}, \theta) \le b a≤W(θ^,θ)≤b 等价变形为 θ ‾ ( X 1 , X 2 , ... , X n ) ≤ θ ≤ θ ‾ ( X 1 , X 2 , ... , X n ) \underline{\theta}(X_1, X_2, \dots, X_n) \le \theta \le \overline{\theta}(X_1, X_2, \dots, X_n) θ(X1,X2,...,Xn)≤θ≤θ(X1,X2,...,Xn)得 P { a ≤ W ( θ ^ , θ ) ≤ b } = P { θ ‾ ( X 1 , X 2 , ... , X n ) ≤ θ ≤ θ ‾ ( X 1 , X 2 , ... , X n ) } = 1 − α . P\{a \le W(\hat{\theta}, \theta) \le b\} = P\{\underline{\theta}(X_1, X_2, \dots, X_n) \le \theta \le \overline{\theta}(X_1, X_2, \dots, X_n)\} = 1 - \alpha. P{a≤W(θ^,θ)≤b}=P{θ(X1,X2,...,Xn)≤θ≤θ(X1,X2,...,Xn)}=1−α.此时参数 θ \theta θ 的置信水平为 1 − α 1-\alpha 1−α 的置信区间为: [ θ ‾ , θ ‾ ] [\underline{\theta}, \overline{\theta}] [θ,θ]

题目: 设 ( X 1 , X 2 , ⋯   , X n ) (X_1, X_2, \cdots, X_n) (X1,X2,⋯,Xn) 是来自均匀分布 U ( 0 , θ ) U(0, \theta) U(0,θ) 的一个样本,对给定的 α ( 0 < α < 1 ) \alpha (0 < \alpha < 1) α(0<α<1), 求 θ \theta θ 的置信水平为 1 − α 1 - \alpha 1−α 的置信区间。

解:由第一章相关知识可知, X ( n ) X_{(n)} X(n) 是 θ \theta θ 的极大似然估计量(此处标注:从点估计出发),其分布函数为: F X ( n ) ( x ) = P { X ( n ) ≤ x } = { ( x / θ ) n , 0 < x < θ 0 , 其他 F_{X_{(n)}}(x) = P\{X_{(n)} \le x\} = \begin{cases} (x/\theta)^n, & 0 < x < \theta \\ 0, & \text{其他} \end{cases} FX(n)(x)=P{X(n)≤x}={(x/θ)n,0,0<x<θ其他取 W ( X ( n ) ; θ ) = X ( n ) θ W(X_{(n)}; \theta) = \frac{X_{(n)}}{\theta} W(X(n);θ)=θX(n)(此处标注:构造函数W包含点估计及参数),其分布函数为: F W ( x ) = { x n , 0 < x < 1 0 , 其他 F_W(x) = \begin{cases} x^n, & 0 < x < 1 \\ 0, & \text{其他} \end{cases} FW(x)={xn,0,0<x<1其他(此处标注:函数W的分布已知且不依赖于参数)选取适当的区间,设(此处标注:选取适当的区间): P { λ ≤ X ( n ) θ ≤ 1 } = 1 − α P \left\{ \lambda \le \frac{X_{(n)}}{\theta} \le 1 \right\} = 1 - \alpha P{λ≤θX(n)≤1}=1−α即: F W ( 1 ) − F W ( λ ) = 1 − α F_W(1) - F_W(\lambda) = 1 - \alpha FW(1)−FW(λ)=1−α解得: λ = α n \lambda = \sqrt[n]{\alpha} λ=nα (此处标注:解出区间的边界值)通过恒等变形得出包含参数的区间(此处标注:通过恒等变形得出包含参数的区间): ∵ P { X ( n ) ≤ θ ≤ X ( n ) α n } = 1 − α \because P \left\{ X_{(n)} \le \theta \le \frac{X_{(n)}}{\sqrt[n]{\alpha}} \right\} = 1 - \alpha ∵P{X(n)≤θ≤nα X(n)}=1−α结论: θ \theta θ 的置信水平为 1 − α 1 - \alpha 1−α 的置信区间为: [ X ( n ) , X ( n ) α n ] \left[ X_{(n)}, \frac{X_{(n)}}{\sqrt[n]{\alpha}} \right] [X(n),nα X(n)]

2.4.2 正态总体均值与方差的区间估计

1️⃣ 单个正态总体的情况

例:设总体 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2), ( X 1 , X 2 , ... , X n ) (X_1, X_2, \dots, X_n) (X1,X2,...,Xn) 是总体 X X X 的样本,求 μ , σ 2 \mu, \sigma^2 μ,σ2 的置信水平为 1 − α 1 - \alpha 1−α 的置信区间。

(a) σ \sigma σ 已知, μ \mu μ 的置信区间

解: X ˉ \bar{X} Xˉ 是 μ \mu μ 的无偏估计,且: Z = X ˉ − μ σ 2 / n ∼ N ( 0 , 1 ) Z = \frac{\bar{X} - \mu}{\sqrt{\sigma^2/n}} \sim N(0, 1) Z=σ2/n Xˉ−μ∼N(0,1)

对于给定的 α ( 0 < α < 1 ) \alpha (0 < \alpha < 1) α(0<α<1),有 P { ∣ X ˉ − μ σ 2 / n ∣ ≤ u 1 − α 2 } = 1 − α P \left\{ \left| \frac{\bar{X} - \mu}{\sqrt{\sigma^2/n}} \right| \le u_{1-\frac{\alpha}{2}} \right\} = 1 - \alpha P{ σ2/n Xˉ−μ ≤u1−2α}=1−α ∴ P { X ˉ − σ 2 n ⋅ u 1 − α 2 ≤ μ ≤ X ˉ + σ 2 n ⋅ u 1 − α 2 } = 1 − α \therefore P \left\{ \bar{X} - \sqrt{\frac{\sigma^2}{n}} \cdot u_{1-\frac{\alpha}{2}} \le \mu \le \bar{X} + \sqrt{\frac{\sigma^2}{n}} \cdot u_{1-\frac{\alpha}{2}} \right\} = 1 - \alpha ∴P{Xˉ−nσ2 ⋅u1−2α≤μ≤Xˉ+nσ2 ⋅u1−2α}=1−α得 μ \mu μ 的置信水平为 1 − α 1 - \alpha 1−α 的置信区间为: [ X ˉ − σ n u 1 − α 2 , X ˉ + σ n u 1 − α 2 ] ( 1 ) \left[ \bar{X} - \frac{\sigma}{\sqrt{n}} u_{1-\frac{\alpha}{2}}, \bar{X} + \frac{\sigma}{\sqrt{n}} u_{1-\frac{\alpha}{2}} \right] \quad (1) [Xˉ−n σu1−2α,Xˉ+n σu1−2α](1)

一般准则:在保证置信度的条件下尽可能提高精度。即置信度不变的情况下,区间长度尽量短。

对称的选取:保证 1 − α 1 - \alpha 1−α 的置信度下区间长度最短。

(b) σ \sigma σ 未知, μ \mu μ 的置信区间

σ 2 \sigma^2 σ2 为未知,因为 S 2 S^2 S2 是 σ 2 \sigma^2 σ2 的无偏估计量,所以用 S S S 替换 σ \sigma σ: X ˉ − μ S / n ∼ t ( n − 1 ) \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n - 1) S/n Xˉ−μ∼t(n−1) P { ∣ X ˉ − μ S / n ∣ ≤ t 1 − α 2 ( n − 1 ) } = 1 − α P \left\{ \left| \frac{\bar{X} - \mu}{S/\sqrt{n}} \right| \le t_{1-\frac{\alpha}{2}}(n - 1) \right\} = 1 - \alpha P{ S/n Xˉ−μ ≤t1−2α(n−1)}=1−α

等价变换: P { X ˉ − t 1 − α 2 ( n − 1 ) S n ≤ μ ≤ X ˉ + t 1 − α 2 ( n − 1 ) S n } = 1 − α P \left\{ \bar{X} - t_{1-\frac{\alpha}{2}}(n - 1) \frac{S}{\sqrt{n}} \le \mu \le \bar{X} + t_{1-\frac{\alpha}{2}}(n - 1) \frac{S}{\sqrt{n}} \right\} = 1 - \alpha P{Xˉ−t1−2α(n−1)n S≤μ≤Xˉ+t1−2α(n−1)n S}=1−α求得 μ \mu μ 的置信水平为 ( 1 − α ) (1 - \alpha) (1−α) 的置信区间 ( σ 2 \sigma^2 σ2 未知): [ X ˉ − t 1 − α 2 ( n − 1 ) S n , X ˉ + t 1 − α 2 ( n − 1 ) S n ] ( 2 ) \left[ \bar{X} - t_{1-\frac{\alpha}{2}}(n - 1) \frac{S}{\sqrt{n}}, \bar{X} + t_{1-\frac{\alpha}{2}}(n - 1) \frac{S}{\sqrt{n}} \right] \quad (2) [Xˉ−t1−2α(n−1)n S,Xˉ+t1−2α(n−1)n S](2)

(c) 方差 σ 2 \sigma^2 σ2 的置信区间 ( μ \mu μ 已知)

当均值 μ \mu μ 已知时,利用以下枢轴变量进行推导: ∑ i = 1 n ( X i − μ ) 2 σ 2 ∼ χ 2 ( n ) \frac{\sum_{i=1}^n (X_i - \mu)^2}{\sigma^2} \sim \chi^2(n) σ2∑i=1n(Xi−μ)2∼χ2(n)给定置信水平 1 − α 1 - \alpha 1−α: P { χ α 2 2 ( n ) ≤ ∑ i = 1 n ( X i − μ ) 2 σ 2 ≤ χ 1 − α 2 2 ( n ) } = 1 − α P \left\{ \chi_{\frac{\alpha}{2}}^2(n) \le \frac{\sum_{i=1}^n (X_i - \mu)^2}{\sigma^2} \le \chi_{1-\frac{\alpha}{2}}^2(n) \right\} = 1 - \alpha P{χ2α2(n)≤σ2∑i=1n(Xi−μ)2≤χ1−2α2(n)}=1−α

即 P { ∑ i = 1 n ( X i − μ ) 2 χ 1 − α 2 2 ( n ) ≤ σ 2 ≤ ∑ i = 1 n ( X i − μ ) 2 χ α 2 2 ( n ) } = 1 − α P \left\{ \frac{\sum_{i=1}^n (X_i - \mu)^2}{\chi_{1-\frac{\alpha}{2}}^2(n)} \le \sigma^2 \le \frac{\sum_{i=1}^n (X_i - \mu)^2}{\chi_{\frac{\alpha}{2}}^2(n)} \right\} = 1 - \alpha P{χ1−2α2(n)∑i=1n(Xi−μ)2≤σ2≤χ2α2(n)∑i=1n(Xi−μ)2}=1−α

得到方差 σ 2 \sigma^2 σ2 的一个置信水平为 1 − α 1 - \alpha 1−α 的置信区间: [ ∑ i = 1 n ( X i − μ ) 2 χ 1 − α 2 2 ( n ) , ∑ i = 1 n ( X i − μ ) 2 χ α 2 2 ( n ) ] ( 3 ) \left[ \frac{\sum_{i=1}^n (X_i - \mu)^2}{\chi_{1-\frac{\alpha}{2}}^2(n)}, \frac{\sum_{i=1}^n (X_i - \mu)^2}{\chi_{\frac{\alpha}{2}}^2(n)} \right] \quad (3) [χ1−2α2(n)∑i=1n(Xi−μ)2,χ2α2(n)∑i=1n(Xi−μ)2](3)标准差 σ \sigma σ 的一个置信水平为 1 − α 1 - \alpha 1−α 的置信区间: [ ∑ i = 1 n ( X i − μ ) 2 χ 1 − α 2 2 ( n ) , ∑ i = 1 n ( X i − μ ) 2 χ α 2 2 ( n ) ] \left[ \sqrt{\frac{\sum_{i=1}^n (X_i - \mu)^2}{\chi_{1-\frac{\alpha}{2}}^2(n)}}, \sqrt{\frac{\sum_{i=1}^n (X_i - \mu)^2}{\chi_{\frac{\alpha}{2}}^2(n)}} \right] [χ1−2α2(n)∑i=1n(Xi−μ)2 ,χ2α2(n)∑i=1n(Xi−μ)2 ]

(d) 方差 σ 2 \sigma^2 σ2 的置信区间 ( μ \mu μ 未知)

σ 2 \sigma^2 σ2 的无偏估计量为 S 2 S^2 S2,利用枢轴变量: ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{(n - 1)S^2}{\sigma^2} \sim \chi^2(n - 1) σ2(n−1)S2∼χ2(n−1)当 1 − α 1 - \alpha 1−α 给定时: P { χ α 2 2 ( n − 1 ) ≤ ( n − 1 ) S 2 σ 2 ≤ χ 1 − α 2 2 ( n − 1 ) } = 1 − α P \left\{ \chi_{\frac{\alpha}{2}}^2(n - 1) \le \frac{(n - 1)S^2}{\sigma^2} \le \chi_{1-\frac{\alpha}{2}}^2(n - 1) \right\} = 1 - \alpha P{χ2α2(n−1)≤σ2(n−1)S2≤χ1−2α2(n−1)}=1−α即: P { ( n − 1 ) S 2 χ 1 − α 2 2 ( n − 1 ) ≤ σ 2 ≤ ( n − 1 ) S 2 χ α 2 2 ( n − 1 ) } = 1 − α P \left\{ \frac{(n - 1)S^2}{\chi_{1-\frac{\alpha}{2}}^2(n - 1)} \le \sigma^2 \le \frac{(n - 1)S^2}{\chi_{\frac{\alpha}{2}}^2(n - 1)} \right\} = 1 - \alpha P{χ1−2α2(n−1)(n−1)S2≤σ2≤χ2α2(n−1)(n−1)S2}=1−α

得到方差 σ 2 \sigma^2 σ2 的一个置信水平为 1 − α 1 - \alpha 1−α 的置信区间: [ ( n − 1 ) S 2 χ 1 − α 2 2 ( n − 1 ) , ( n − 1 ) S 2 χ α 2 2 ( n − 1 ) ] ( 4 ) \left[ \frac{(n-1)S^2}{\chi_{1-\frac{\alpha}{2}}^2(n-1)}, \frac{(n-1)S^2}{\chi_{\frac{\alpha}{2}}^2(n-1)} \right] \quad (4) [χ1−2α2(n−1)(n−1)S2,χ2α2(n−1)(n−1)S2](4)

标准差 σ \sigma σ 的一个置信水平为 1 − α 1 - \alpha 1−α 的置信区间: [ ( n − 1 ) S 2 χ 1 − α 2 2 ( n − 1 ) , ( n − 1 ) S 2 χ α 2 2 ( n − 1 ) ] \left[ \sqrt{\frac{(n-1)S^2}{\chi_{1-\frac{\alpha}{2}}^2(n-1)}}, \sqrt{\frac{(n-1)S^2}{\chi_{\frac{\alpha}{2}}^2(n-1)}} \right] [χ1−2α2(n−1)(n−1)S2 ,χ2α2(n−1)(n−1)S2 ]

2️⃣ 两个正态总体的情况

设总体 X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) X \sim N(\mu_1, \sigma_1^2), Y \sim N(\mu_2, \sigma_2^2) X∼N(μ1,σ12),Y∼N(μ2,σ22), ( X 1 , X 2 , ... , X n 1 ) (X_1, X_2, \dots, X_{n1}) (X1,X2,...,Xn1) 是 X X X 的样本, ( Y 1 , Y 2 , ... , Y n 2 ) (Y_1, Y_2, \dots, Y_{n2}) (Y1,Y2,...,Yn2) 是 Y Y Y 的样本。这两个样本相互独立, X ˉ , Y ˉ , S 1 2 , S 2 2 \bar{X}, \bar{Y}, S_1^2, S_2^2 Xˉ,Yˉ,S12,S22 分别为第一、二个总体的样本均值与样本方差。

(1) 两个总体均值差 μ 1 − μ 2 \mu_1 - \mu_2 μ1−μ2 的置信区间 (置信度为 1 − α 1 - \alpha 1−α)

(a) σ 1 2 , σ 2 2 \sigma_1^2, \sigma_2^2 σ12,σ22 均为已知

因 X ˉ − Y ˉ \bar{X} - \bar{Y} Xˉ−Yˉ 为 μ 1 − μ 2 \mu_1 - \mu_2 μ1−μ2 的无偏估计量,而 X ˉ − Y ˉ ∼ N ( μ 1 − μ 2 , σ 1 2 n 1 + σ 2 2 n 2 ) \bar{X} - \bar{Y} \sim N\left( \mu_1 - \mu_2, \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} \right) Xˉ−Yˉ∼N(μ1−μ2,n1σ12+n2σ22) ( X ˉ − Y ˉ ) − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) \frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0, 1) n1σ12+n2σ22 (Xˉ−Yˉ)−(μ1−μ2)∼N(0,1)

即得 μ 1 − μ 2 \mu_1 - \mu_2 μ1−μ2 的 ( 1 − α ) (1 - \alpha) (1−α) 置信区间: [ ( X ˉ − Y ˉ ) ± u 1 − α 2 σ 1 2 n 1 + σ 2 2 n 2 ] ( 5 ) \left[ (\bar{X} - \bar{Y}) \pm u_{1-\frac{\alpha}{2}} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}} \right] \quad (5) (Xˉ−Yˉ)±u1−2αn1σ12+n2σ22 (5)

(b) σ 1 2 = σ 2 2 = σ 2 \sigma_1^2 = \sigma_2^2 = \sigma^2 σ12=σ22=σ2,但 σ 2 \sigma^2 σ2 为未知

由第一章定理知: ( X ˉ − Y ˉ ) − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 ∼ t n 1 + n 2 − 2 \frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t_{n_1 + n_2 - 2} Swn11+n21 (Xˉ−Yˉ)−(μ1−μ2)∼tn1+n2−2

此处: S w 2 = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 , S w = S w 2 S_w^2 = \frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2}, \quad S_w = \sqrt{S_w^2} Sw2=n1+n2−2(n1−1)S12+(n2−1)S22,Sw=Sw2

从而可得 μ 1 − μ 2 \mu_1 - \mu_2 μ1−μ2 的一个置信度为 1 − α 1 - \alpha 1−α 的置信区间为: [ ( X ˉ − Y ˉ ) ± S w ⋅ t 1 − α 2 ( n 1 + n 2 − 2 ) 1 n 1 + 1 n 2 ] ( 6 ) \left[ (\bar{X} - \bar{Y}) \pm S_w \cdot t_{1-\frac{\alpha}{2}}(n_1 + n_2 - 2) \sqrt{\frac{1}{n_1} + \frac{1}{n_2}} \right] \quad (6) [(Xˉ−Yˉ)±Sw⋅t1−2α(n1+n2−2)n11+n21 ](6)

(2) 两个总体方差比 σ 1 2 / σ 2 2 \sigma_1^2 / \sigma_2^2 σ12/σ22 的置信区间 ( μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2 为未知)

由第一章定理知: S 1 2 / S 2 2 σ 1 2 / σ 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) \frac{S_1^2 / S_2^2}{\sigma_1^2 / \sigma_2^2} \sim F(n_1 - 1, n_2 - 1) σ12/σ22S12/S22∼F(n1−1,n2−1) P { F α 2 ( n 1 − 1 , n 2 − 1 ) ≤ S 1 2 / S 2 2 σ 1 2 / σ 2 2 ≤ F 1 − α 2 ( n 1 − 1 , n 2 − 1 ) } = 1 − α P \left\{ F_{\frac{\alpha}{2}}(n_1 - 1, n_2 - 1) \le \frac{S_1^2 / S_2^2}{\sigma_1^2 / \sigma_2^2} \le F_{1-\frac{\alpha}{2}}(n_1 - 1, n_2 - 1) \right\} = 1 - \alpha P{F2α(n1−1,n2−1)≤σ12/σ22S12/S22≤F1−2α(n1−1,n2−1)}=1−α即: P { 1 F 1 − α 2 ( n 1 − 1 , n 2 − 1 ) S 1 2 S 2 2 ≤ σ 1 2 σ 2 2 ≤ 1 F α 2 ( n 1 − 1 , n 2 − 1 ) S 1 2 S 2 2 } = 1 − α P \left\{ \frac{1}{F_{1-\frac{\alpha}{2}}(n_1 - 1, n_2 - 1)} \frac{S_1^2}{S_2^2} \le \frac{\sigma_1^2}{\sigma_2^2} \le \frac{1}{F_{\frac{\alpha}{2}}(n_1 - 1, n_2 - 1)} \frac{S_1^2}{S_2^2} \right\} = 1 - \alpha P{F1−2α(n1−1,n2−1)1S22S12≤σ22σ12≤F2α(n1−1,n2−1)1S22S12}=1−α于是得 σ 1 2 / σ 2 2 \sigma_1^2 / \sigma_2^2 σ12/σ22 的一个置信度为 1 − α 1 - \alpha 1−α 的置信区间为: [ S 1 2 S 2 2 F α 2 ( n 2 − 1 , n 1 − 1 ) , S 1 2 S 2 2 F 1 − α 2 ( n 2 − 1 , n 1 − 1 ) ] ( 7 ) \left[ \frac{S_1^2}{S_2^2} F_{\frac{\alpha}{2}}(n_2 - 1, n_1 - 1), \quad \frac{S_1^2}{S_2^2} F_{1-\frac{\alpha}{2}}(n_2 - 1, n_1 - 1) \right] \quad (7) [S22S12F2α(n2−1,n1−1),S22S12F1−2α(n2−1,n1−1)](7)

注: 这里利用了 F F F 分布的性质: F 1 − α ( d 1 , d 2 ) = 1 F α ( d 2 , d 1 ) F_{1-\alpha}(d_1, d_2) = \frac{1}{F_{\alpha}(d_2, d_1)} F1−α(d1,d2)=Fα(d2,d1)1。

3️⃣ 单侧置信区间

定义: 对于给定值 α \alpha α ( 0 < α < 1 0 < \alpha < 1 0<α<1),若由样本 ( X 1 , X 2 , ... , X n ) (X_1, X_2, \dots, X_n) (X1,X2,...,Xn) 确定的统计量 θ ‾ = θ ‾ ( X 1 , X 2 , ... , X n ) \underline{\theta} = \underline{\theta}(X_1, X_2, \dots, X_n) θ=θ(X1,X2,...,Xn),对任意 θ ∈ Θ \theta \in \Theta θ∈Θ 满足: P { θ > θ ‾ } = 1 − α P \{ \theta > \underline{\theta} \} = 1 - \alpha P{θ>θ}=1−α

则称随机区间 ( θ ‾ , + ∞ ) (\underline{\theta}, +\infty) (θ,+∞) 是 θ \theta θ 的置信水平为 1 − α 1 - \alpha 1−α 的单侧置信区间, θ ‾ \underline{\theta} θ 称为 θ \theta θ 的置信水平为 1 − α 1 - \alpha 1−α 的单侧置信下限。

又若统计量 θ ‾ = θ ‾ ( X 1 , X 2 , ... , X n ) \overline{\theta} = \overline{\theta}(X_1, X_2, \dots, X_n) θ=θ(X1,X2,...,Xn),对任意 θ ∈ Θ \theta \in \Theta θ∈Θ 满足: P { θ < θ ‾ } = 1 − α P \{ \theta < \overline{\theta} \} = 1 - \alpha P{θ<θ}=1−α

则称随机区间 ( − ∞ , θ ‾ ) (-\infty, \overline{\theta}) (−∞,θ) 是 θ \theta θ 的置信水平为 1 − α 1 - \alpha 1−α 的单侧置信区间, θ ‾ \overline{\theta} θ 称为 θ \theta θ 的置信水平为 1 − α 1 - \alpha 1−α 的单侧置信上限。

例:求 μ \mu μ 的置信度为 1 − α 1-\alpha 1−α 的单侧置信区间

设 σ 2 \sigma^2 σ2 未知, ( X 1 , X 2 , ... , X n ) (X_1, X_2, \dots, X_n) (X1,X2,...,Xn) 是取自总体 X X X 的样本。由于: X ˉ − μ S / n ∼ t ( n − 1 ) \frac{\bar{X} - \mu}{S / \sqrt{n}} \sim t(n - 1) S/n Xˉ−μ∼t(n−1)

通过枢轴变量性质可得: P { X ˉ − μ S / n < t 1 − α ( n − 1 ) } = 1 − α P \left\{ \frac{\bar{X} - \mu}{S / \sqrt{n}} < t_{1-\alpha}(n - 1) \right\} = 1 - \alpha P{S/n Xˉ−μ<t1−α(n−1)}=1−α

即: P { μ > X ˉ − S n t 1 − α ( n − 1 ) } = 1 − α P \left\{ \mu > \bar{X} - \frac{S}{\sqrt{n}} t_{1-\alpha}(n - 1) \right\} = 1 - \alpha P{μ>Xˉ−n St1−α(n−1)}=1−α

于是得到 μ \mu μ 的一个置信度为 1 − α 1 - \alpha 1−α 的单侧置信区间: ( X ˉ − S n t 1 − α ( n − 1 ) , + ∞ ) \left( \bar{X} - \frac{S}{\sqrt{n}} t_{1-\alpha}(n - 1), +\infty \right) (Xˉ−n St1−α(n−1),+∞)
μ \mu μ 的置信度为 1 − α 1 - \alpha 1−α 的单侧置信下限为: X ˉ − S n t 1 − α ( n − 1 ) \bar{X} - \frac{S}{\sqrt{n}} t_{1-\alpha}(n - 1) Xˉ−n St1−α(n−1)

例 6: 从一批灯泡中随机地取 5 只作寿命试验,测得寿命 (以小时计) 为:1050, 1100, 1120, 1250, 1280。设灯泡寿命服从正态分布,求灯泡寿命平均值 μ \mu μ 的置信度为 0.95 的单侧置信下限。

解: μ \mu μ 的置信度为 1 − α 1 - \alpha 1−α 的单侧置信下限公式为: x ˉ − s n t 1 − α ( n − 1 ) \bar{x} - \frac{s}{\sqrt{n}} t_{1-\alpha}(n - 1) xˉ−n st1−α(n−1)已知数据:样本均值: x ˉ = 1160 \bar{x} = 1160 xˉ=1160样本方差: s 2 = 9950 s^2 = 9950 s2=9950 (由此可得 s = 9950 ≈ 99.75 s = \sqrt{9950} \approx 99.75 s=9950 ≈99.75)

样本量: n = 5 n = 5 n=5置信水平: 1 − α = 0.95 1 - \alpha = 0.95 1−α=0.95

查表: 自由度为 4 时, t 0.95 ( 4 ) = 2.1318 t_{0.95}(4) = 2.1318 t0.95(4)=2.1318

计算结果:代入公式计算,得所求单侧置信下限为 1065 小时。

相关推荐
Carl_奕然1 小时前
【智能体】Agent的四种设计模式之:ReAct
人工智能·设计模式·语言模型
小白64021 小时前
AI辅助设计Flutter蓝牙自动连接系统
人工智能·flutter
DeepReinforce1 小时前
二、AI量化投资:沪市主板A股所有股票20250430到20260430双均线(MA5/MA20)回测结果
人工智能·量化
普贤莲花1 小时前
【2026年第18周---写于20260501】---舍得
程序人生·算法·leetcode
2zcode1 小时前
基于深度学习的口腔疾病图像识别系统(UI界面+改进算法+数据集+训练代码)
人工智能·深度学习·算法
whyfail1 小时前
AI 平台订阅套餐 Coding Plan 、Token Plan对比指南(2026年4月)
人工智能·ai·chatgpt·订阅套餐·平台对比
小龙报1 小时前
【Coze-AI智能体平台】低代码省时高效:Coze 应用开发全流程指南
java·人工智能·python·深度学习·低代码·chatgpt·交互
初恋叫萱萱1 小时前
【腾讯位置服务开发者征文大赛】地图不再“冷静”:当腾讯位置服务遇上 AI,我打造了一个 AI 智能出行“全能大脑”
人工智能