【TJU】应用统计学——第四周作业（2.3 C-R不等式、2.4区间估计）

【TJU】应用统计学------第四周作业（2.3 C-R不等式、2.4区间估计）

一、判断题
- 题目1～2
二、单选题
三、填空题
- 题目14
四、多选题
- 题目15

一、判断题

题目1～2

1️⃣ 设 θ ^ 1 , θ ^ 2 \hat{\theta}_1, \hat{\theta}_2 θ^1,θ^2 是 θ \theta θ 的点估计，若 D ( θ ^ 1 ) ≤ D ( θ ^ 2 ) D(\hat{\theta}_1) \le D(\hat{\theta}_2) D(θ^1)≤D(θ^2), 则 θ ^ 1 \hat{\theta}_1 θ^1 比 θ ^ 2 \hat{\theta}_2 θ^2 更有效。

A. 对

B. 错 ✅

解析过程：

本题考查数理统计中衡量估计量优劣的标准------**有效性（Efficiency）**的严格定义。

1. 有效性的定义前提 ：在统计学中，"有效性"是专门用来比较无偏估计量 方差大小的术语。

设 θ ^ 1 \hat{\theta}_1 θ^1 和 θ ^ 2 \hat{\theta}_2 θ^2 是未知参数 θ \theta θ 的两个无偏估计量 （即满足 E ( θ ^ 1 ) = θ E(\hat{\theta}_1) = \theta E(θ^1)=θ 且 E ( θ ^ 2 ) = θ E(\hat{\theta}_2) = \theta E(θ^2)=θ），如果满足： D ( θ ^ 1 ) ≤ D ( θ ^ 2 ) D(\hat{\theta}_1) \le D(\hat{\theta}_2) D(θ^1)≤D(θ^2)，则称 θ ^ 1 \hat{\theta}_1 θ^1 比 θ ^ 2 \hat{\theta}_2 θ^2 有效（或更有效）。

2. 本题陷阱分析 ：题目仅提到 θ ^ 1 \hat{\theta}_1 θ^1 和 θ ^ 2 \hat{\theta}_2 θ^2 是 θ \theta θ 的点估计 ，并没有限定它们必须是无偏的。

方差小不一定更优 ：如果一个估计量具有很大的偏差（Bias），即使它的方差 D ( θ ^ ) D(\hat{\theta}) D(θ^) 很小（例如 θ ^ \hat{\theta} θ^ 恒等于一个常数时方差为 0），它也不能准确地反映参数真实值。
综合衡量标准 ：对于一般的点估计（包含有偏估计），我们通常使用均方误差（MSE） 来衡量其优劣，公式为：
M S E ( θ ^ ) = E [ ( θ ^ − θ ) 2 ] = D ( θ ^ ) + [ E ( θ ^ ) − θ ] 2 MSE(\hat{\theta}) = E[(\hat{\theta} - \theta)^2] = D(\hat{\theta}) + [E(\hat{\theta}) - \theta]^2 MSE(θ^)=E[(θ^−θ)2]=D(θ^)+[E(θ^)−θ]2
即均方误差 = 方差 + 偏差的平方。只有在无偏（偏差为 0）的前提下，比较方差大小才有意义。

结论：由于缺少"无偏估计"这一必要前提，该说法在统计学定义上是不严谨且错误的。

答案：B. 错

2️⃣ C-R 下界是待估参数所有无偏估计的方差下界。

A. 对

B. 错 ✅

答案：B. 错

二、单选题

题目3～5

3️⃣ 设 X 1 , X 2 , ⋯ , X n X_1, X_2, \cdots, X_n X1,X2,⋯,Xn 是总体 X ∼ G a ( 1 2 , λ ) X \sim Ga(\frac{1}{2}, \lambda) X∼Ga(21,λ) 的简单随机样本，其中 λ \lambda λ 未知，则 λ \lambda λ 的无偏估计量的方差下界为 ( )

A. λ 2 n \frac{\lambda^2}{n} nλ2

B. λ 2 2 n \frac{\lambda^2}{2n} 2nλ2

C. 2 λ 2 n \frac{2\lambda^2}{n} n2λ2 ✅

D. λ n \frac{\lambda}{n} nλ

解析过程： 本题要求计算参数 λ \lambda λ 的无偏估计量的方差下界，即 Cramér-Rao 下界 (CRLB)。

1. 写出总体的概率密度函数 ：对于 Gamma 分布 G a ( α , λ ) Ga(\alpha, \lambda) Ga(α,λ)，通常采用率参数化（Rate Parameterization）定义：
f ( x ; λ ) = λ α Γ ( α ) x α − 1 e − λ x , x > 0 f(x; \lambda) = \frac{\lambda^\alpha}{\Gamma(\alpha)} x^{\alpha-1} e^{-\lambda x}, \quad x > 0 f(x;λ)=Γ(α)λαxα−1e−λx,x>0

本题中 α = 1 2 \alpha = \frac{1}{2} α=21，代入得：
f ( x ; λ ) = λ 1 / 2 Γ ( 1 / 2 ) x − 1 / 2 e − λ x f(x; \lambda) = \frac{\lambda^{1/2}}{\Gamma(1/2)} x^{-1/2} e^{-\lambda x} f(x;λ)=Γ(1/2)λ1/2x−1/2e−λx

2. 计算对数似然函数的导数（评分函数） ：

对单个观测值取对数：
ln ⁡ f ( x ; λ ) = 1 2 ln ⁡ λ − ln ⁡ Γ ( 1 / 2 ) − 1 2 ln ⁡ x − λ x \ln f(x; \lambda) = \frac{1}{2} \ln \lambda - \ln \Gamma(1/2) - \frac{1}{2} \ln x - \lambda x lnf(x;λ)=21lnλ−lnΓ(1/2)−21lnx−λx

对 λ \lambda λ 求一阶偏导：
∂ ln ⁡ f ∂ λ = 1 2 λ − x \frac{\partial \ln f}{\partial \lambda} = \frac{1}{2\lambda} - x ∂λ∂lnf=2λ1−x

3. 计算单样本 Fisher 信息量 I ( λ ) I(\lambda) I(λ) ：

对 λ \lambda λ 求二阶偏导：
∂ 2 ln ⁡ f ∂ λ 2 = − 1 2 λ 2 \frac{\partial^2 \ln f}{\partial \lambda^2} = -\frac{1}{2\lambda^2} ∂λ2∂2lnf=−2λ21

由于该结果不含随机变量 X X X，其期望即为其本身：
I ( λ ) = − E [ ∂ 2 ln ⁡ f ∂ λ 2 ] = 1 2 λ 2 I(\lambda) = -E\left[ \frac{\partial^2 \ln f}{\partial \lambda^2} \right] = \frac{1}{2\lambda^2} I(λ)=−E[∂λ2∂2lnf]=2λ21

4. 计算 n n n 个样本的方差下界 ：

根据 C-R 不等式，无偏估计量 λ ^ \hat{\lambda} λ^ 的方差满足：
V a r ( λ ^ ) ≥ 1 n I ( λ ) Var(\hat{\lambda}) \ge \frac{1}{n I(\lambda)} Var(λ^)≥nI(λ)1

代入 I ( λ ) I(\lambda) I(λ)：
C R L B = 1 n ⋅ 1 2 λ 2 = 2 λ 2 n CRLB = \frac{1}{n \cdot \frac{1}{2\lambda^2}} = \frac{2\lambda^2}{n} CRLB=n⋅2λ211=n2λ2

答案：C. 2 λ 2 n \frac{2\lambda^2}{n} n2λ2

4️⃣ 点估计的缺点是 ( )

A. 不能给出总体参数的准确估计

B. 不能给出总体参数的有效估计

C. 不能给出总体参数估计的近似程度 ✅

解析过程：

1. 点估计的定义 ：

点估计是依据样本数据计算出一个单一的值（点），直接作为总体参数 θ \theta θ 的估计值值（例如用样本均值 X ˉ \bar{X} Xˉ 估计总体均值 μ \mu μ）。

2. 优缺点分析：

优点：形式简单，使用方便，在很多实际场景中能直接给出一个具体的数值参考。
缺点：由于抽样的随机性，样本点估计值几乎不可能恰好等于总体参数的真值。最重要的一点是，点估计本身无法反映这个估计值与真值之间的接近程度（即可靠性或精度）。

3. 对比区间估计 ：

为了弥补这一缺点，统计学中引入了区间估计。区间估计不仅提供一个范围，还通过"置信水平"给出了参数落在该范围内的概率（即估计的近似程度和可靠性）。

结论：点估计虽然给出了一个"数"，但没法告诉我们这个"数"有多准，因此答案选 C。

答案：C. 不能给出总体参数估计的近似程度

5️⃣ 对于方差 σ 2 \sigma^2 σ2 已知的正态总体 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2), 为使总体均值 μ \mu μ 的置信水平为 1 − α 1 - \alpha 1−α 的置信区间长度不大于 L L L, 则样本容量 n n n 应取 ( )

A. n > ( σ L u 1 − α 2 ) 2 n > \left( \frac{\sigma}{L} u_{1-\frac{\alpha}{2}} \right)^2 n>(Lσu1−2α)2

B. n > ( 2 σ L u 1 − α 2 ) 2 n > \left( \frac{2\sigma}{L} u_{1-\frac{\alpha}{2}} \right)^2 n>(L2σu1−2α)2 ✅

C. n > 2 σ L u 1 − α n > \frac{2\sigma}{L} u_{1-\alpha} n>L2σu1−α

D. n > ( 2 σ L u 1 − α ) 2 n > \left( \frac{2\sigma}{L} u_{1-\alpha} \right)^2 n>(L2σu1−α)2

解析过程：

1. 确定置信区间公式 ：

在总体方差 σ 2 \sigma^2 σ2 已知的情况下，总体均值 μ \mu μ 的置信水平为 1 − α 1 - \alpha 1−α 的置信区间为：

X ˉ − σ n u 1 − α 2 , X ˉ + σ n u 1 − α 2 \] \\left\[ \\bar{X} - \\frac{\\sigma}{\\sqrt{n}} u_{1-\\frac{\\alpha}{2}}, \\bar{X} + \\frac{\\sigma}{\\sqrt{n}} u_{1-\\frac{\\alpha}{2}} \\right\] \[Xˉ−n σu1−2α,Xˉ+n σu1−2α

其中 u 1 − α 2 u_{1-\frac{\alpha}{2}} u1−2α 为标准正态分布的上 α 2 \frac{\alpha}{2} 2α 分位数（或双侧分位数）。

2. 计算置信区间长度 ：

置信区间的长度（记作 d d d）为上限减去下限：
d = ( X ˉ + σ n u 1 − α 2 ) − ( X ˉ − σ n u 1 − α 2 ) = 2 σ n u 1 − α 2 d = \left( \bar{X} + \frac{\sigma}{\sqrt{n}} u_{1-\frac{\alpha}{2}} \right) - \left( \bar{X} - \frac{\sigma}{\sqrt{n}} u_{1-\frac{\alpha}{2}} \right) = \frac{2\sigma}{\sqrt{n}} u_{1-\frac{\alpha}{2}} d=(Xˉ+n σu1−2α)−(Xˉ−n σu1−2α)=n 2σu1−2α

3. 建立不等式求解 n n n ：

根据题目要求，长度不大于 L L L：
2 σ n u 1 − α 2 ≤ L \frac{2\sigma}{\sqrt{n}} u_{1-\frac{\alpha}{2}} \le L n 2σu1−2α≤L

整理不等式，将 n \sqrt{n} n 移至一侧：
n ≥ 2 σ L u 1 − α 2 \sqrt{n} \ge \frac{2\sigma}{L} u_{1-\frac{\alpha}{2}} n ≥L2σu1−2α

两边平方得：
n ≥ ( 2 σ L u 1 − α 2 ) 2 n \ge \left( \frac{2\sigma}{L} u_{1-\frac{\alpha}{2}} \right)^2 n≥(L2σu1−2α)2

结论：为了满足长度限制，样本容量 n n n 必须大于等于该计算值。

答案：B. n > ( 2 σ L u 1 − α 2 ) 2 n > \left( \frac{2\sigma}{L} u_{1-\frac{\alpha}{2}} \right)^2 n>(L2σu1−2α)2

题目6～8

6️⃣ 设 X 1 , X 2 , ⋯ , X n X_1, X_2, \cdots, X_n X1,X2,⋯,Xn 是总体 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2) 的简单随机样本，其中 μ , σ 2 \mu, \sigma^2 μ,σ2 均未知，则 μ \mu μ 的置信度为 1 − α 1-\alpha 1−α 的置信区间的长度 E ( L 2 ) = ( ) E(L^2) = (\quad) E(L2)=()

A. σ 2 n t 1 − α 2 ( n − 1 ) \frac{\sigma^2}{n} t^2_{1-\alpha}(n-1) nσ2t1−α2(n−1)

B. σ 2 n t 1 − α 2 ( n ) \frac{\sigma^2}{n} t^2_{1-\alpha}(n) nσ2t1−α2(n)

C. 4 σ 2 n t 1 − α 2 2 ( n − 1 ) \frac{4\sigma^2}{n} t^2_{1-\frac{\alpha}{2}}(n-1) n4σ2t1−2α2(n−1) ✅

D. 4 σ 2 n t 1 − α 2 2 ( n ) \frac{4\sigma^2}{n} t^2_{1-\frac{\alpha}{2}}(n) n4σ2t1−2α2(n)

解析过程：

1. 确定置信区间公式 ：

当正态总体的方差 σ 2 \sigma^2 σ2 未知时，总体均值 μ \mu μ 的置信水平为 1 − α 1-\alpha 1−α 的置信区间采用 t t t 分布构造：

X ˉ − S n t 1 − α 2 ( n − 1 ) , X ˉ + S n t 1 − α 2 ( n − 1 ) \] \\left\[ \\bar{X} - \\frac{S}{\\sqrt{n}} t_{1-\\frac{\\alpha}{2}}(n-1), \\bar{X} + \\frac{S}{\\sqrt{n}} t_{1-\\frac{\\alpha}{2}}(n-1) \\right\] \[Xˉ−n St1−2α(n−1),Xˉ+n St1−2α(n−1)

其中 S S S 为样本标准差， t 1 − α 2 ( n − 1 ) t_{1-\frac{\alpha}{2}}(n-1) t1−2α(n−1) 为自由度为 n − 1 n-1 n−1 的 t t t 分布的双侧分位数。

2. 计算置信区间长度 L L L 及其平方 L 2 L^2 L2 ：

长度 L L L 为区间上限与下限之差：
L = 2 S n t 1 − α 2 ( n − 1 ) L = \frac{2S}{\sqrt{n}} t_{1-\frac{\alpha}{2}}(n-1) L=n 2St1−2α(n−1)

平方得：
L 2 = 4 S 2 n t 1 − α 2 2 ( n − 1 ) L^2 = \frac{4S^2}{n} t_{1-\frac{\alpha}{2}}^2(n-1) L2=n4S2t1−2α2(n−1)

3. 求 L 2 L^2 L2 的期望 E ( L 2 ) E(L^2) E(L2) ：

利用期望的线性性质：
E ( L 2 ) = E [ 4 S 2 n t 1 − α 2 2 ( n − 1 ) ] = 4 t 1 − α 2 2 ( n − 1 ) n E ( S 2 ) E(L^2) = E\left[ \frac{4S^2}{n} t_{1-\frac{\alpha}{2}}^2(n-1) \right] = \frac{4 t_{1-\frac{\alpha}{2}}^2(n-1)}{n} E(S^2) E(L2)=E[n4S2t1−2α2(n−1)]=n4t1−2α2(n−1)E(S2)

由于样本方差 S 2 S^2 S2 是总体方差 σ 2 \sigma^2 σ2 的无偏估计量，即 E ( S 2 ) = σ 2 E(S^2) = \sigma^2 E(S2)=σ2，代入上式得：
E ( L 2 ) = 4 σ 2 n t 1 − α 2 2 ( n − 1 ) E(L^2) = \frac{4\sigma^2}{n} t_{1-\frac{\alpha}{2}}^2(n-1) E(L2)=n4σ2t1−2α2(n−1)

答案：C. 4 σ 2 n t 1 − α 2 2 ( n − 1 ) \frac{4\sigma^2}{n} t^2_{1-\frac{\alpha}{2}}(n-1) n4σ2t1−2α2(n−1)

7️⃣ 若 X ∼ N ( 0 , 1 ) X \sim N(0,1) X∼N(0,1)，对于给定的 α ( 0 < α < 1 ) \alpha (0 < \alpha < 1) α(0<α<1)，数 x α x_\alpha xα 满足 P { X < x α } = α P\{X < x_\alpha\} = \alpha P{X<xα}=α。若 P { ∣ X ∣ < x } = α P\{|X| < x\} = \alpha P{∣X∣<x}=α，则 x = ( ) x = (\quad) x=()

A. x α x_\alpha xα

B. x 1 − α 2 x_{1 - \frac{\alpha}{2}} x1−2α

C. x 1 + α 2 x_{\frac{1+\alpha}{2}} x21+α ✅

D. x 1 − α 2 x_{\frac{1-\alpha}{2}} x21−α

解析过程：

1. 理解分位数的定义 ：

题目给出 x α x_\alpha xα 满足 P { X < x α } = α P\{X < x_\alpha\} = \alpha P{X<xα}=α。在标准正态分布中，这表示 x α x_\alpha xα 是累积分布函数（CDF）等于 α \alpha α 时对应的点，即 Φ ( x α ) = α \Phi(x_\alpha) = \alpha Φ(xα)=α。

2. 利用对称性解方程 ：

已知 X ∼ N ( 0 , 1 ) X \sim N(0,1) X∼N(0,1)，对于 P { ∣ X ∣ < x } = α P\{|X| < x\} = \alpha P{∣X∣<x}=α：
P { − x < X < x } = α P\{-x < X < x\} = \alpha P{−x<X<x}=α

由于正态分布关于 0 对称，上式可转化为：
Φ ( x ) − Φ ( − x ) = α \Phi(x) - \Phi(-x) = \alpha Φ(x)−Φ(−x)=α

利用性质 Φ ( − x ) = 1 − Φ ( x ) \Phi(-x) = 1 - \Phi(x) Φ(−x)=1−Φ(x)：
Φ ( x ) − ( 1 − Φ ( x ) ) = α 2 Φ ( x ) − 1 = α 2 Φ ( x ) = 1 + α Φ ( x ) = 1 + α 2 \Phi(x) - (1 - \Phi(x)) = \alpha\\ 2\Phi(x) - 1 = \alpha \\ 2\Phi(x) = 1 + \alpha \\ \Phi(x) = \frac{1+\alpha}{2} Φ(x)−(1−Φ(x))=α2Φ(x)−1=α2Φ(x)=1+αΦ(x)=21+α

3. 对比定义得出结果 ：

由于我们要寻找的 x x x 满足 Φ ( x ) = 1 + α 2 \Phi(x) = \frac{1+\alpha}{2} Φ(x)=21+α，而题目定义了 Φ ( x γ ) = γ \Phi(x_\gamma) = \gamma Φ(xγ)=γ。

令 γ = 1 + α 2 \gamma = \frac{1+\alpha}{2} γ=21+α，则有：
x = x 1 + α 2 x = x_{\frac{1+\alpha}{2}} x=x21+α

结论：当双侧概率为 α \alpha α 时，单侧累积概率为 1 + α 2 \frac{1+\alpha}{2} 21+α。

答案：C. x 1 + α 2 x_{\frac{1+\alpha}{2}} x21+α

8️⃣ 设总体 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2)，总体均值 μ \mu μ 的置信度为 1 − α 1-\alpha 1−α 的置信区间的长度为 L L L，则当 1 − α 1-\alpha 1−α 减小时（）

A. 当 1 − α 1-\alpha 1−α 减小时， L L L 变小 ✅

B. 当 1 − α 1-\alpha 1−α 减小时， L L L 不变

C. 当 1 − α 1-\alpha 1−α 减小时， L L L 变大

D. L L L 增减不确定

解析过程：

1. 确定置信区间长度公式 ：

对于正态总体 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2)，均值 μ \mu μ 的置信水平为 1 − α 1-\alpha 1−α 的置信区间长度 L L L 的计算公式为：

若 σ 2 \sigma^2 σ2 已知： L = 2 ⋅ σ n u 1 − α 2 L = 2 \cdot \frac{\sigma}{\sqrt{n}} u_{1-\frac{\alpha}{2}} L=2⋅n σu1−2α
若 σ 2 \sigma^2 σ2 未知： L = 2 ⋅ S n t 1 − α 2 ( n − 1 ) L = 2 \cdot \frac{S}{\sqrt{n}} t_{1-\frac{\alpha}{2}}(n-1) L=2⋅n St1−2α(n−1)
其中 u 1 − α 2 u_{1-\frac{\alpha}{2}} u1−2α 或 t 1 − α 2 t_{1-\frac{\alpha}{2}} t1−2α 是临界值（分位数）。

2. 分析变量间的逻辑关系：

置信度 1 − α 1-\alpha 1−α 减小 ⟹ \implies ⟹ 显著性水平 α \alpha α 增大。
当 α \alpha α 增大时，分布两端尾部的面积增大，这意味着中间覆盖的面积减小。
对应的临界值 u 1 − α 2 u_{1-\frac{\alpha}{2}} u1−2α（或 t 1 − α 2 t_{1-\frac{\alpha}{2}} t1−2α）会随之减小。

3. 结论推导 ：

由于置信区间长度 L L L 与临界值成正比，当临界值减小时，长度 L L L 也会随之变小。

直观理解：置信度代表我们对"参数落在区间内"的把握程度。如果我们降低要求的把握程度（从 95% 降低到 90%），我们就不需要那么宽的区间来保证准确性，因此区间会变窄。

答案：A. 当 1 − α 1-\alpha 1−α 减小时， L L L 变小

题目9～11

9️⃣ 设样本 X 1 , X 2 , ⋯ , X n X_1, X_2, \cdots, X_n X1,X2,⋯,Xn 取自两点分布 b ( 1 , p ) b(1, p) b(1,p)，其中 p p p 未知，则 ( 1 − p ) 2 (1 - p)^2 (1−p)2 的无偏估计的方差至少为 ( ) (\quad) ()

A. 4 p 2 ( 1 − p ) n \frac{4p^2(1 - p)}{n} n4p2(1−p)

B. 4 p ( 1 − p ) 3 n \frac{4p(1 - p)^3}{n} n4p(1−p)3 ✅

C. 4 p ( 1 − p ) 2 n \frac{4p(1 - p)^2}{n} n4p(1−p)2

解析过程： 本题要求计算参数函数 g ( p ) = ( 1 − p ) 2 g(p) = (1 - p)^2 g(p)=(1−p)2 的无偏估计量的方差下界，即 Cramér-Rao (C-R) 下界。

1. 写出单样本的概率质量函数及其对数形式 ：

对于两点分布 b ( 1 , p ) b(1, p) b(1,p)，其概率质量函数为：
f ( x ; p ) = p x ( 1 − p ) 1 − x , x = 0 , 1 f(x; p) = p^x (1 - p)^{1-x}, \quad x = 0, 1 f(x;p)=px(1−p)1−x,x=0,1

取对数得：
ln ⁡ f ( x ; p ) = x ln ⁡ p + ( 1 − x ) ln ⁡ ( 1 − p ) \ln f(x; p) = x \ln p + (1 - x) \ln(1 - p) lnf(x;p)=xlnp+(1−x)ln(1−p)

2. 计算单样本的 Fisher 信息量 I ( p ) I(p) I(p) ：

对 p p p 求二阶导数：

一阶导数（评分函数）： ∂ ln ⁡ f ∂ p = x p − 1 − x 1 − p \frac{\partial \ln f}{\partial p} = \frac{x}{p} - \frac{1 - x}{1 - p} ∂p∂lnf=px−1−p1−x
二阶导数： ∂ 2 ln ⁡ f ∂ p 2 = − x p 2 − 1 − x ( 1 − p ) 2 \frac{\partial^2 \ln f}{\partial p^2} = -\frac{x}{p^2} - \frac{1 - x}{(1 - p)^2} ∂p2∂2lnf=−p2x−(1−p)21−x

取负期望得到 I ( p ) I(p) I(p)（已知两点分布的期望 E ( X ) = p E(X) = p E(X)=p）：
I ( p ) = − E [ ∂ 2 ln ⁡ f ∂ p 2 ] = E ( X ) p 2 + 1 − E ( X ) ( 1 − p ) 2 = p p 2 + 1 − p ( 1 − p ) 2 = 1 p + 1 1 − p = 1 p ( 1 − p ) I(p) = -E\left[ \frac{\partial^2 \ln f}{\partial p^2} \right] = \frac{E(X)}{p^2} + \frac{1 - E(X)}{(1 - p)^2} = \frac{p}{p^2} + \frac{1 - p}{(1 - p)^2} = \frac{1}{p} + \frac{1}{1 - p} = \frac{1}{p(1 - p)} I(p)=−E[∂p2∂2lnf]=p2E(X)+(1−p)21−E(X)=p2p+(1−p)21−p=p1+1−p1=p(1−p)1

3. 确定待估参数函数 g ( p ) g(p) g(p) 及其导数的平方 ：

已知 g ( p ) = ( 1 − p ) 2 g(p) = (1 - p)^2 g(p)=(1−p)2，对其求导得：
g ′ ( p ) = 2 ( 1 − p ) ⋅ ( − 1 ) = − 2 ( 1 − p ) g'(p) = 2(1 - p) \cdot (-1) = -2(1 - p) g′(p)=2(1−p)⋅(−1)=−2(1−p)

导数的平方为：

g ′ ( p ) \] 2 = 4 ( 1 − p ) 2 \[g'(p)\]\^2 = 4(1 - p)\^2 \[g′(p)\]2=4(1−p)2   4. **利用 C-R 不等式计算 n n n 个样本的方差下界** ： V a r ( g \^ ( p ) ) ≥ \[ g ′ ( p ) \] 2 n I ( p ) Var(\\hat{g}(p)) \\ge \\frac{\[g'(p)\]\^2}{n I(p)} Var(g\^(p))≥nI(p)\[g′(p)\]2   代入上述结果： C R L B = 4 ( 1 − p ) 2 n ⋅ 1 p ( 1 − p ) = 4 ( 1 − p ) 2 ⋅ p ( 1 − p ) n = 4 p ( 1 − p ) 3 n CRLB = \\frac{4(1 - p)\^2}{n \\cdot \\frac{1}{p(1 - p)}} = \\frac{4(1 - p)\^2 \\cdot p(1 - p)}{n} = \\frac{4p(1 - p)\^3}{n} CRLB=n⋅p(1−p)14(1−p)2=n4(1−p)2⋅p(1−p)=n4p(1−p)3 *** ** * ** ***   **答案** ：B. 4 p ( 1 − p ) 3 n \\frac{4p(1 - p)\^3}{n} n4p(1−p)3 *** ** * ** *** *** ** * ** *** > 1️⃣0️⃣ 有一大批糖果，现从中随机地取 16 袋，称得重量（以克计）如下： > > 506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496. 设袋装糖果的重量近似地服从正态分布，则总体均值的置信度为 0.95 的置信区间为 ( ) > > * A. (500.4, 507.1) ✅ > * B. (495.3, 513.5) *** ** * ** ***   **解析过程：** 这是一个关于正态总体均值 μ \\mu μ 的区间估计问题，且总体方差 σ 2 \\sigma\^2 σ2 未知，样本容量 n = 16 n = 16 n=16 为小样本，需使用 t t t 分布。   1. **计算样本均值 x ˉ \\bar{x} xˉ** ： x ˉ = 1 16 ∑ i = 1 16 x i = 8060 16 = 503.75 \\bar{x} = \\frac{1}{16} \\sum_{i=1}\^{16} x_i = \\frac{8060}{16} = 503.75 xˉ=161i=1∑16xi=168060=503.75   2. **计算样本标准差 s s s** ：   通过公式 s = 1 n − 1 ∑ i = 1 n ( x i − x ˉ ) 2 s = \\sqrt{\\frac{1}{n-1} \\sum_{i=1}\^{n} (x_i - \\bar{x})\^2} s=n−11∑i=1n(xi−xˉ)2 计算： ∑ x i 2 = 506 2 + 508 2 + ⋯ + 496 2 = 4 , 060 , 802 \\sum x_i\^2 = 506\^2 + 508\^2 + \\dots + 496\^2 = 4,060,802 ∑xi2=5062+5082+⋯+4962=4,060,802 s = 4 , 060 , 802 − 16 ⋅ 503.75 2 15 ≈ 6.202 s = \\sqrt{\\frac{4,060,802 - 16 \\cdot 503.75\^2}{15}} \\approx 6.202 s=154,060,802−16⋅503.752 ≈6.202   3. **确定置信水平及分位数** ：   置信度 1 − α = 0.95 1 - \\alpha = 0.95 1−α=0.95，则 α = 0.05 \\alpha = 0.05 α=0.05。   自由度 d f = n − 1 = 15 df = n - 1 = 15 df=n−1=15。查表得 t t t 分布的双侧临界值： t α / 2 ( n − 1 ) = t 0.025 ( 15 ) ≈ 2.131 t_{\\alpha/2}(n-1) = t_{0.025}(15) \\approx 2.131 tα/2(n−1)=t0.025(15)≈2.131   4. **构造置信区间** ：   置信区间公式为 \[ x ˉ ± s n t α / 2 ( n − 1 ) \] \\left\[ \\bar{x} \\pm \\frac{s}{\\sqrt{n}} t_{\\alpha/2}(n-1) \\right\] \[xˉ±n stα/2(n−1)\]： * 误差限 d = 6.202 16 × 2.131 = 1.5505 × 2.131 ≈ 3.304 d = \\frac{6.202}{\\sqrt{16}} \\times 2.131 = 1.5505 \\times 2.131 \\approx 3.304 d=16 6.202×2.131=1.5505×2.131≈3.304 * 下限： 503.75 − 3.304 = 500.446 503.75 - 3.304 = 500.446 503.75−3.304=500.446 * 上限： 503.75 + 3.304 = 507.054 503.75 + 3.304 = 507.054 503.75+3.304=507.054   **结论**：对应的置信区间约为 (500.4, 507.1)。 *** ** * ** ***   **答案**：A. (500.4, 507.1) *** ** * ** *** > 1️⃣1️⃣ 置信区间的置信度是指： > > * A. 置信区间包含参数真实值的概率 ✅ > * B. 区间长度 **答案：** A. 置信区间包含参数真实值的概率 *** ** * ** ***    ### 题目12～13 > 1️⃣2️⃣ 设 X 1 , X 2 , ⋯   , X n X_1, X_2, \\cdots, X_n X1,X2,⋯,Xn 是正态总体 N ( μ , σ 2 ) N(\\mu, \\sigma\^2) N(μ,σ2) 的样本，其中 μ , σ 2 \\mu, \\sigma\^2 μ,σ2 都是未知参数，则 μ \\mu μ 的置信水平为 1 − α 1-\\alpha 1−α 的单侧置信下限为 ________ (结果用分位数表示). > > * A. X ˉ − t 1 − α 2 ( n − 1 ) S n \\bar{X} - t_{1-\\frac{\\alpha}{2}}(n-1) \\frac{S}{\\sqrt{n}} Xˉ−t1−2α(n−1)n S > * B. X ˉ − t 1 − α ( n − 1 ) S n \\bar{X} - t_{1-\\alpha}(n-1) \\frac{S}{\\sqrt{n}} Xˉ−t1−α(n−1)n S ✅ > * C. X ˉ − t 1 − α 2 ( n ) S n \\bar{X} - t_{1-\\frac{\\alpha}{2}}(n) \\frac{S}{\\sqrt{n}} Xˉ−t1−2α(n)n S > * D. X ˉ − t 1 − α ( n − 1 ) σ n \\bar{X} - t_{1-\\alpha}(n-1) \\frac{\\sigma}{\\sqrt{n}} Xˉ−t1−α(n−1)n σ *** ** * ** ***   **解析过程：**   1. **选择统计量** ：   由于总体方差 σ 2 \\sigma\^2 σ2 未知，构造含有待估参数 μ \\mu μ 的 t t t 统计量： T = X ˉ − μ S / n ∼ t ( n − 1 ) T = \\frac{\\bar{X} - \\mu}{S / \\sqrt{n}} \\sim t(n-1) T=S/n Xˉ−μ∼t(n−1)   其中 X ˉ \\bar{X} Xˉ 是样本均值， S S S 是样本标准差。   2. **确定分位数定义** ：   根据前序题目（如题目7）的定义， x α x_\\alpha xα 满足 P { X \< x α } = α P\\{X \< x_\\alpha\\} = \\alpha P{X\ X ˉ − t 1 − α ( n − 1 ) S n \\mu \> \\bar{X} - t_{1-\\alpha}(n-1) \\frac{S}{\\sqrt{n}} μ\>Xˉ−t1−α(n−1)n S   4. **结论分析**： * 这里的 1 − α 1-\\alpha 1−α 是置信度，要求的是单侧下限，故分位数下标应为 1 − α 1-\\alpha 1−α 而非双侧的 1 − α / 2 1-\\alpha/2 1−α/2（排除 A、C）。 * 因为 σ \\sigma σ 未知，必须使用样本标准差 S S S（排除 D）。 *** ** * ** ***   **答案** ：B. X ˉ − t 1 − α ( n − 1 ) S n \\bar{X} - t_{1-\\alpha}(n-1) \\frac{S}{\\sqrt{n}} Xˉ−t1−α(n−1)n S *** ** * ** *** > 1️⃣3️⃣ \> 设总体密度为 f ( x , θ ) = 2 θ x 3 e − θ x 2 , x , θ \> 0 f(x, \\theta) = \\frac{2\\theta}{x\^3} e\^{-\\frac{\\theta}{x\^2}}, x, \\theta \> 0 f(x,θ)=x32θe−x2θ,x,θ\>0, 求 θ \\theta θ 的 Fisher 信息量 I ( θ ) = ‾ I(\\theta) = \\underline{\\quad} I(θ)= > > * A. 1 θ \\frac{1}{\\theta} θ1 > * B. 1 θ 2 \\frac{1}{\\theta\^2} θ21 ✅ > * C. 1 2 θ 2 \\frac{1}{2\\theta\^2} 2θ21 > * D. 2 θ 2 \\frac{2}{\\theta\^2} θ22 *** ** * ** ***   **解析过程：** Fisher 信息量 I ( θ ) I(\\theta) I(θ) 的定义为对数似然函数二阶偏导数负值的期望，即： I ( θ ) = − E \[ ∂ 2 ln ⁡ f ( X ; θ ) ∂ θ 2 \] I(\\theta) = -E\\left\[ \\frac{\\partial\^2 \\ln f(X; \\theta)}{\\partial \\theta\^2} \\right\] I(θ)=−E\[∂θ2∂2lnf(X;θ)

1. 写出对数似然函数 ：

对 f ( x , θ ) f(x, \theta) f(x,θ) 取自然对数：
ln ⁡ f ( x ; θ ) = ln ⁡ ( 2 θ x 3 e − θ x 2 ) \ln f(x; \theta) = \ln \left( \frac{2\theta}{x^3} e^{-\frac{\theta}{x^2}} \right) lnf(x;θ)=ln(x32θe−x2θ)
ln ⁡ f ( x ; θ ) = ln ⁡ 2 + ln ⁡ θ − 3 ln ⁡ x − θ x 2 \ln f(x; \theta) = \ln 2 + \ln \theta - 3 \ln x - \frac{\theta}{x^2} lnf(x;θ)=ln2+lnθ−3lnx−x2θ

2. 求关于参数 θ \theta θ 的一阶导数（评分函数） ：
∂ ln ⁡ f ( x ; θ ) ∂ θ = 1 θ − 1 x 2 \frac{\partial \ln f(x; \theta)}{\partial \theta} = \frac{1}{\theta} - \frac{1}{x^2} ∂θ∂lnf(x;θ)=θ1−x21

3. 求关于参数 θ \theta θ 的二阶导数 ：
∂ 2 ln ⁡ f ( x ; θ ) ∂ θ 2 = ∂ ∂ θ ( 1 θ − 1 x 2 ) = − 1 θ 2 \frac{\partial^2 \ln f(x; \theta)}{\partial \theta^2} = \frac{\partial}{\partial \theta} \left( \frac{1}{\theta} - \frac{1}{x^2} \right) = -\frac{1}{\theta^2} ∂θ2∂2lnf(x;θ)=∂θ∂(θ1−x21)=−θ21

4. 计算 Fisher 信息量 ：

由于二阶导数 − 1 θ 2 -\frac{1}{\theta^2} −θ21 是一个常数（不依赖于随机变量 X X X），其期望即为其本身：
I ( θ ) = − E [ − 1 θ 2 ] = 1 θ 2 I(\theta) = -E\left[ -\frac{1}{\theta^2} \right] = \frac{1}{\theta^2} I(θ)=−E[−θ21]=θ21

答案：B. 1 θ 2 \frac{1}{\theta^2} θ21

三、填空题

题目14

1️⃣4️⃣ 在稳定生产的情况下，某工厂生产的电灯泡使用时数可认为服从正态分布。观察 20 个灯泡的使用时数，测得其平均寿命为 1832 小时，标准差为 497 小时。试构造灯泡使用寿命的总体平均值 95% 的置信区间。（保留一位小数）

第 1 空：________________

解析过程：

1. 识别已知条件：

样本容量 n = 20 n = 20 n=20
样本均值 x ˉ = 1832 \bar{x} = 1832 xˉ=1832
样本标准差 s = 497 s = 497 s=497
置信水平 1 − α = 0.95 1 - \alpha = 0.95 1−α=0.95，则 α = 0.05 \alpha = 0.05 α=0.05

2. 选择统计量 ：

由于总体方差 σ 2 \sigma^2 σ2 未知，且总体服从正态分布，应使用 t t t 分布构造置信区间：
x ˉ − μ s / n ∼ t ( n − 1 ) \frac{\bar{x} - \mu}{s / \sqrt{n}} \sim t(n-1) s/n xˉ−μ∼t(n−1)

3. 确定临界值 ：

自由度 d f = n − 1 = 19 df = n - 1 = 19 df=n−1=19。查表（或计算）得 t t t 分布的双侧临界值 t α / 2 ( 19 ) t_{\alpha/2}(19) tα/2(19)：
t 0.025 ( 19 ) ≈ 2.093 t_{0.025}(19) \approx 2.093 t0.025(19)≈2.093

4. 计算误差限（置信半径） E E E ：
E = t α / 2 ( n − 1 ) ⋅ s n = 2.093 ⋅ 497 20 E = t_{\alpha/2}(n-1) \cdot \frac{s}{\sqrt{n}} = 2.093 \cdot \frac{497}{\sqrt{20}} E=tα/2(n−1)⋅n s=2.093⋅20 497
E ≈ 2.093 ⋅ 497 4.472 ≈ 2.093 ⋅ 111.13 ≈ 232.6 E \approx 2.093 \cdot \frac{497}{4.472} \approx 2.093 \cdot 111.13 \approx 232.6 E≈2.093⋅4.472497≈2.093⋅111.13≈232.6

5. 计算置信区间 [ x ˉ − E , x ˉ + E ] [\bar{x} - E, \bar{x} + E] [xˉ−E,xˉ+E]：

下限： 1832 − 232.6 = 1599.4 1832 - 232.6 = 1599.4 1832−232.6=1599.4
上限： 1832 + 232.6 = 2064.6 1832 + 232.6 = 2064.6 1832+232.6=2064.6

结论：总体平均值的 95% 置信区间为 ( 1599.4 , 2064.6 ) (1599.4, 2064.6) (1599.4,2064.6)。

答案：(1599.4, 2064.6)

四、多选题

题目15

1️⃣5️⃣ 关于参数的置信度为 90% 的置信区间，以下正确的是

A. 参数是固定的常数，没有随机性 ✅

B. 置信区间是随机区间，随样本的不同而变化 ✅

C. 随机区间以 90% 的概率包含参数 ✅

D. 参数是变化的，其落在置信区间内的概率为 90%

解析过程：

频率学派观点 (A/B)：在经典统计中，待估参数是一个固定值，随机性来自于样本及其生成的区间。
错误辨析 (D)：参数本身不变化，也不存在"落在"区间的说法（因为它是固定的），而是区间"覆盖"参数。

答案：ABC