【TJU】应用统计学------第四周作业(2.3 C-R不等式、2.4区间估计)
一、判断题
题目1~2
1️⃣ 设 θ ^ 1 , θ ^ 2 \hat{\theta}_1, \hat{\theta}_2 θ^1,θ^2 是 θ \theta θ 的点估计,若 D ( θ ^ 1 ) ≤ D ( θ ^ 2 ) D(\hat{\theta}_1) \le D(\hat{\theta}_2) D(θ^1)≤D(θ^2), 则 θ ^ 1 \hat{\theta}_1 θ^1 比 θ ^ 2 \hat{\theta}_2 θ^2 更有效。
- A. 对
- B. 错 ✅
解析过程:
本题考查数理统计中衡量估计量优劣的标准------**有效性(Efficiency)**的严格定义。
1. 有效性的定义前提 :在统计学中,"有效性"是专门用来比较无偏估计量 方差大小的术语。
设 θ ^ 1 \hat{\theta}_1 θ^1 和 θ ^ 2 \hat{\theta}_2 θ^2 是未知参数 θ \theta θ 的两个无偏估计量 (即满足 E ( θ ^ 1 ) = θ E(\hat{\theta}_1) = \theta E(θ^1)=θ 且 E ( θ ^ 2 ) = θ E(\hat{\theta}_2) = \theta E(θ^2)=θ),如果满足: D ( θ ^ 1 ) ≤ D ( θ ^ 2 ) D(\hat{\theta}_1) \le D(\hat{\theta}_2) D(θ^1)≤D(θ^2),则称 θ ^ 1 \hat{\theta}_1 θ^1 比 θ ^ 2 \hat{\theta}_2 θ^2 有效(或更有效)。
2. 本题陷阱分析 :题目仅提到 θ ^ 1 \hat{\theta}_1 θ^1 和 θ ^ 2 \hat{\theta}_2 θ^2 是 θ \theta θ 的点估计 ,并没有限定它们必须是无偏的。
- 方差小不一定更优 :如果一个估计量具有很大的偏差(Bias),即使它的方差 D ( θ ^ ) D(\hat{\theta}) D(θ^) 很小(例如 θ ^ \hat{\theta} θ^ 恒等于一个常数时方差为 0),它也不能准确地反映参数真实值。
- 综合衡量标准 :对于一般的点估计(包含有偏估计),我们通常使用均方误差(MSE) 来衡量其优劣,公式为:
M S E ( θ ^ ) = E [ ( θ ^ − θ ) 2 ] = D ( θ ^ ) + [ E ( θ ^ ) − θ ] 2 MSE(\hat{\theta}) = E[(\hat{\theta} - \theta)^2] = D(\hat{\theta}) + [E(\hat{\theta}) - \theta]^2 MSE(θ^)=E[(θ^−θ)2]=D(θ^)+[E(θ^)−θ]2
即均方误差 = 方差 + 偏差的平方。只有在无偏(偏差为 0)的前提下,比较方差大小才有意义。
结论:由于缺少"无偏估计"这一必要前提,该说法在统计学定义上是不严谨且错误的。
答案:B. 错
2️⃣ C-R 下界是待估参数所有无偏估计的方差下界。
- A. 对
- B. 错 ✅
答案:B. 错
二、单选题
题目3~5
3️⃣ 设 X 1 , X 2 , ⋯ , X n X_1, X_2, \cdots, X_n X1,X2,⋯,Xn 是总体 X ∼ G a ( 1 2 , λ ) X \sim Ga(\frac{1}{2}, \lambda) X∼Ga(21,λ) 的简单随机样本,其中 λ \lambda λ 未知,则 λ \lambda λ 的无偏估计量的方差下界为 ( )
- A. λ 2 n \frac{\lambda^2}{n} nλ2
- B. λ 2 2 n \frac{\lambda^2}{2n} 2nλ2
- C. 2 λ 2 n \frac{2\lambda^2}{n} n2λ2 ✅
- D. λ n \frac{\lambda}{n} nλ
解析过程: 本题要求计算参数 λ \lambda λ 的无偏估计量的方差下界,即 Cramér-Rao 下界 (CRLB)。
1. 写出总体的概率密度函数 :对于 Gamma 分布 G a ( α , λ ) Ga(\alpha, \lambda) Ga(α,λ),通常采用率参数化(Rate Parameterization)定义:
f ( x ; λ ) = λ α Γ ( α ) x α − 1 e − λ x , x > 0 f(x; \lambda) = \frac{\lambda^\alpha}{\Gamma(\alpha)} x^{\alpha-1} e^{-\lambda x}, \quad x > 0 f(x;λ)=Γ(α)λαxα−1e−λx,x>0
本题中 α = 1 2 \alpha = \frac{1}{2} α=21,代入得:
f ( x ; λ ) = λ 1 / 2 Γ ( 1 / 2 ) x − 1 / 2 e − λ x f(x; \lambda) = \frac{\lambda^{1/2}}{\Gamma(1/2)} x^{-1/2} e^{-\lambda x} f(x;λ)=Γ(1/2)λ1/2x−1/2e−λx
2. 计算对数似然函数的导数(评分函数) :
对单个观测值取对数:
ln f ( x ; λ ) = 1 2 ln λ − ln Γ ( 1 / 2 ) − 1 2 ln x − λ x \ln f(x; \lambda) = \frac{1}{2} \ln \lambda - \ln \Gamma(1/2) - \frac{1}{2} \ln x - \lambda x lnf(x;λ)=21lnλ−lnΓ(1/2)−21lnx−λx
对 λ \lambda λ 求一阶偏导:
∂ ln f ∂ λ = 1 2 λ − x \frac{\partial \ln f}{\partial \lambda} = \frac{1}{2\lambda} - x ∂λ∂lnf=2λ1−x
3. 计算单样本 Fisher 信息量 I ( λ ) I(\lambda) I(λ) :
对 λ \lambda λ 求二阶偏导:
∂ 2 ln f ∂ λ 2 = − 1 2 λ 2 \frac{\partial^2 \ln f}{\partial \lambda^2} = -\frac{1}{2\lambda^2} ∂λ2∂2lnf=−2λ21
由于该结果不含随机变量 X X X,其期望即为其本身:
I ( λ ) = − E [ ∂ 2 ln f ∂ λ 2 ] = 1 2 λ 2 I(\lambda) = -E\left[ \frac{\partial^2 \ln f}{\partial \lambda^2} \right] = \frac{1}{2\lambda^2} I(λ)=−E[∂λ2∂2lnf]=2λ21
4. 计算 n n n 个样本的方差下界 :
根据 C-R 不等式,无偏估计量 λ ^ \hat{\lambda} λ^ 的方差满足:
V a r ( λ ^ ) ≥ 1 n I ( λ ) Var(\hat{\lambda}) \ge \frac{1}{n I(\lambda)} Var(λ^)≥nI(λ)1
代入 I ( λ ) I(\lambda) I(λ):
C R L B = 1 n ⋅ 1 2 λ 2 = 2 λ 2 n CRLB = \frac{1}{n \cdot \frac{1}{2\lambda^2}} = \frac{2\lambda^2}{n} CRLB=n⋅2λ211=n2λ2
答案 :C. 2 λ 2 n \frac{2\lambda^2}{n} n2λ2
4️⃣ 点估计的缺点是 ( )
A. 不能给出总体参数的准确估计
B. 不能给出总体参数的有效估计
C. 不能给出总体参数估计的近似程度 ✅
解析过程:
1. 点估计的定义 :
点估计是依据样本数据计算出一个单一的值(点),直接作为总体参数 θ \theta θ 的估计值值(例如用样本均值 X ˉ \bar{X} Xˉ 估计总体均值 μ \mu μ)。
2. 优缺点分析:
- 优点:形式简单,使用方便,在很多实际场景中能直接给出一个具体的数值参考。
- 缺点 :由于抽样的随机性,样本点估计值几乎不可能恰好等于总体参数的真值。最重要的一点是,点估计本身无法反映这个估计值与真值之间的接近程度(即可靠性或精度)。
3. 对比区间估计 :
为了弥补这一缺点,统计学中引入了区间估计。区间估计不仅提供一个范围,还通过"置信水平"给出了参数落在该范围内的概率(即估计的近似程度和可靠性)。
结论:点估计虽然给出了一个"数",但没法告诉我们这个"数"有多准,因此答案选 C。
答案:C. 不能给出总体参数估计的近似程度
5️⃣ 对于方差 σ 2 \sigma^2 σ2 已知的正态总体 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2), 为使总体均值 μ \mu μ 的置信水平为 1 − α 1 - \alpha 1−α 的置信区间长度不大于 L L L, 则样本容量 n n n 应取 ( )
- A. n > ( σ L u 1 − α 2 ) 2 n > \left( \frac{\sigma}{L} u_{1-\frac{\alpha}{2}} \right)^2 n>(Lσu1−2α)2
- B. n > ( 2 σ L u 1 − α 2 ) 2 n > \left( \frac{2\sigma}{L} u_{1-\frac{\alpha}{2}} \right)^2 n>(L2σu1−2α)2 ✅
- C. n > 2 σ L u 1 − α n > \frac{2\sigma}{L} u_{1-\alpha} n>L2σu1−α
- D. n > ( 2 σ L u 1 − α ) 2 n > \left( \frac{2\sigma}{L} u_{1-\alpha} \right)^2 n>(L2σu1−α)2
解析过程:
1. 确定置信区间公式 :
在总体方差 σ 2 \sigma^2 σ2 已知的情况下,总体均值 μ \mu μ 的置信水平为 1 − α 1 - \alpha 1−α 的置信区间为:
X ˉ − σ n u 1 − α 2 , X ˉ + σ n u 1 − α 2 \] \\left\[ \\bar{X} - \\frac{\\sigma}{\\sqrt{n}} u_{1-\\frac{\\alpha}{2}}, \\bar{X} + \\frac{\\sigma}{\\sqrt{n}} u_{1-\\frac{\\alpha}{2}} \\right\] \[Xˉ−n σu1−2α,Xˉ+n σu1−2α
其中 u 1 − α 2 u_{1-\frac{\alpha}{2}} u1−2α 为标准正态分布的上 α 2 \frac{\alpha}{2} 2α 分位数(或双侧分位数)。
2. 计算置信区间长度 :
置信区间的长度(记作 d d d)为上限减去下限:
d = ( X ˉ + σ n u 1 − α 2 ) − ( X ˉ − σ n u 1 − α 2 ) = 2 σ n u 1 − α 2 d = \left( \bar{X} + \frac{\sigma}{\sqrt{n}} u_{1-\frac{\alpha}{2}} \right) - \left( \bar{X} - \frac{\sigma}{\sqrt{n}} u_{1-\frac{\alpha}{2}} \right) = \frac{2\sigma}{\sqrt{n}} u_{1-\frac{\alpha}{2}} d=(Xˉ+n σu1−2α)−(Xˉ−n σu1−2α)=n 2σu1−2α
3. 建立不等式求解 n n n :
根据题目要求,长度不大于 L L L:
2 σ n u 1 − α 2 ≤ L \frac{2\sigma}{\sqrt{n}} u_{1-\frac{\alpha}{2}} \le L n 2σu1−2α≤L
整理不等式,将 n \sqrt{n} n 移至一侧:
n ≥ 2 σ L u 1 − α 2 \sqrt{n} \ge \frac{2\sigma}{L} u_{1-\frac{\alpha}{2}} n ≥L2σu1−2α
两边平方得:
n ≥ ( 2 σ L u 1 − α 2 ) 2 n \ge \left( \frac{2\sigma}{L} u_{1-\frac{\alpha}{2}} \right)^2 n≥(L2σu1−2α)2
结论 :为了满足长度限制,样本容量 n n n 必须大于等于该计算值。
答案 :B. n > ( 2 σ L u 1 − α 2 ) 2 n > \left( \frac{2\sigma}{L} u_{1-\frac{\alpha}{2}} \right)^2 n>(L2σu1−2α)2
题目6~8
6️⃣ 设 X 1 , X 2 , ⋯ , X n X_1, X_2, \cdots, X_n X1,X2,⋯,Xn 是总体 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2) 的简单随机样本,其中 μ , σ 2 \mu, \sigma^2 μ,σ2 均未知,则 μ \mu μ 的置信度为 1 − α 1-\alpha 1−α 的置信区间的长度 E ( L 2 ) = ( ) E(L^2) = (\quad) E(L2)=()
- A. σ 2 n t 1 − α 2 ( n − 1 ) \frac{\sigma^2}{n} t^2_{1-\alpha}(n-1) nσ2t1−α2(n−1)
- B. σ 2 n t 1 − α 2 ( n ) \frac{\sigma^2}{n} t^2_{1-\alpha}(n) nσ2t1−α2(n)
- C. 4 σ 2 n t 1 − α 2 2 ( n − 1 ) \frac{4\sigma^2}{n} t^2_{1-\frac{\alpha}{2}}(n-1) n4σ2t1−2α2(n−1) ✅
- D. 4 σ 2 n t 1 − α 2 2 ( n ) \frac{4\sigma^2}{n} t^2_{1-\frac{\alpha}{2}}(n) n4σ2t1−2α2(n)
解析过程:
1. 确定置信区间公式 :
当正态总体的方差 σ 2 \sigma^2 σ2 未知时,总体均值 μ \mu μ 的置信水平为 1 − α 1-\alpha 1−α 的置信区间采用 t t t 分布构造:
X ˉ − S n t 1 − α 2 ( n − 1 ) , X ˉ + S n t 1 − α 2 ( n − 1 ) \] \\left\[ \\bar{X} - \\frac{S}{\\sqrt{n}} t_{1-\\frac{\\alpha}{2}}(n-1), \\bar{X} + \\frac{S}{\\sqrt{n}} t_{1-\\frac{\\alpha}{2}}(n-1) \\right\] \[Xˉ−n St1−2α(n−1),Xˉ+n St1−2α(n−1)
其中 S S S 为样本标准差, t 1 − α 2 ( n − 1 ) t_{1-\frac{\alpha}{2}}(n-1) t1−2α(n−1) 为自由度为 n − 1 n-1 n−1 的 t t t 分布的双侧分位数。
2. 计算置信区间长度 L L L 及其平方 L 2 L^2 L2 :
长度 L L L 为区间上限与下限之差:
L = 2 S n t 1 − α 2 ( n − 1 ) L = \frac{2S}{\sqrt{n}} t_{1-\frac{\alpha}{2}}(n-1) L=n 2St1−2α(n−1)
平方得:
L 2 = 4 S 2 n t 1 − α 2 2 ( n − 1 ) L^2 = \frac{4S^2}{n} t_{1-\frac{\alpha}{2}}^2(n-1) L2=n4S2t1−2α2(n−1)
3. 求 L 2 L^2 L2 的期望 E ( L 2 ) E(L^2) E(L2) :
利用期望的线性性质:
E ( L 2 ) = E [ 4 S 2 n t 1 − α 2 2 ( n − 1 ) ] = 4 t 1 − α 2 2 ( n − 1 ) n E ( S 2 ) E(L^2) = E\left[ \frac{4S^2}{n} t_{1-\frac{\alpha}{2}}^2(n-1) \right] = \frac{4 t_{1-\frac{\alpha}{2}}^2(n-1)}{n} E(S^2) E(L2)=E[n4S2t1−2α2(n−1)]=n4t1−2α2(n−1)E(S2)
由于样本方差 S 2 S^2 S2 是总体方差 σ 2 \sigma^2 σ2 的无偏估计量,即 E ( S 2 ) = σ 2 E(S^2) = \sigma^2 E(S2)=σ2,代入上式得:
E ( L 2 ) = 4 σ 2 n t 1 − α 2 2 ( n − 1 ) E(L^2) = \frac{4\sigma^2}{n} t_{1-\frac{\alpha}{2}}^2(n-1) E(L2)=n4σ2t1−2α2(n−1)
答案 :C. 4 σ 2 n t 1 − α 2 2 ( n − 1 ) \frac{4\sigma^2}{n} t^2_{1-\frac{\alpha}{2}}(n-1) n4σ2t1−2α2(n−1)
7️⃣ 若 X ∼ N ( 0 , 1 ) X \sim N(0,1) X∼N(0,1),对于给定的 α ( 0 < α < 1 ) \alpha (0 < \alpha < 1) α(0<α<1),数 x α x_\alpha xα 满足 P { X < x α } = α P\{X < x_\alpha\} = \alpha P{X<xα}=α。若 P { ∣ X ∣ < x } = α P\{|X| < x\} = \alpha P{∣X∣<x}=α,则 x = ( ) x = (\quad) x=()
- A. x α x_\alpha xα
- B. x 1 − α 2 x_{1 - \frac{\alpha}{2}} x1−2α
- C. x 1 + α 2 x_{\frac{1+\alpha}{2}} x21+α ✅
- D. x 1 − α 2 x_{\frac{1-\alpha}{2}} x21−α
解析过程:
1. 理解分位数的定义 :
题目给出 x α x_\alpha xα 满足 P { X < x α } = α P\{X < x_\alpha\} = \alpha P{X<xα}=α。在标准正态分布中,这表示 x α x_\alpha xα 是累积分布函数(CDF)等于 α \alpha α 时对应的点,即 Φ ( x α ) = α \Phi(x_\alpha) = \alpha Φ(xα)=α。
2. 利用对称性解方程 :
已知 X ∼ N ( 0 , 1 ) X \sim N(0,1) X∼N(0,1),对于 P { ∣ X ∣ < x } = α P\{|X| < x\} = \alpha P{∣X∣<x}=α:
P { − x < X < x } = α P\{-x < X < x\} = \alpha P{−x<X<x}=α
由于正态分布关于 0 对称,上式可转化为:
Φ ( x ) − Φ ( − x ) = α \Phi(x) - \Phi(-x) = \alpha Φ(x)−Φ(−x)=α
利用性质 Φ ( − x ) = 1 − Φ ( x ) \Phi(-x) = 1 - \Phi(x) Φ(−x)=1−Φ(x):
Φ ( x ) − ( 1 − Φ ( x ) ) = α 2 Φ ( x ) − 1 = α 2 Φ ( x ) = 1 + α Φ ( x ) = 1 + α 2 \Phi(x) - (1 - \Phi(x)) = \alpha\\ 2\Phi(x) - 1 = \alpha \\ 2\Phi(x) = 1 + \alpha \\ \Phi(x) = \frac{1+\alpha}{2} Φ(x)−(1−Φ(x))=α2Φ(x)−1=α2Φ(x)=1+αΦ(x)=21+α
3. 对比定义得出结果 :
由于我们要寻找的 x x x 满足 Φ ( x ) = 1 + α 2 \Phi(x) = \frac{1+\alpha}{2} Φ(x)=21+α,而题目定义了 Φ ( x γ ) = γ \Phi(x_\gamma) = \gamma Φ(xγ)=γ。
令 γ = 1 + α 2 \gamma = \frac{1+\alpha}{2} γ=21+α,则有:
x = x 1 + α 2 x = x_{\frac{1+\alpha}{2}} x=x21+α
结论 :当双侧概率为 α \alpha α 时,单侧累积概率为 1 + α 2 \frac{1+\alpha}{2} 21+α。
答案 :C. x 1 + α 2 x_{\frac{1+\alpha}{2}} x21+α
8️⃣ 设总体 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2),总体均值 μ \mu μ 的置信度为 1 − α 1-\alpha 1−α 的置信区间的长度为 L L L,则当 1 − α 1-\alpha 1−α 减小时( )
- A. 当 1 − α 1-\alpha 1−α 减小时, L L L 变小 ✅
- B. 当 1 − α 1-\alpha 1−α 减小时, L L L 不变
- C. 当 1 − α 1-\alpha 1−α 减小时, L L L 变大
- D. L L L 增减不确定
解析过程:
1. 确定置信区间长度公式 :
对于正态总体 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2),均值 μ \mu μ 的置信水平为 1 − α 1-\alpha 1−α 的置信区间长度 L L L 的计算公式为:
- 若 σ 2 \sigma^2 σ2 已知: L = 2 ⋅ σ n u 1 − α 2 L = 2 \cdot \frac{\sigma}{\sqrt{n}} u_{1-\frac{\alpha}{2}} L=2⋅n σu1−2α
- 若 σ 2 \sigma^2 σ2 未知: L = 2 ⋅ S n t 1 − α 2 ( n − 1 ) L = 2 \cdot \frac{S}{\sqrt{n}} t_{1-\frac{\alpha}{2}}(n-1) L=2⋅n St1−2α(n−1)
其中 u 1 − α 2 u_{1-\frac{\alpha}{2}} u1−2α 或 t 1 − α 2 t_{1-\frac{\alpha}{2}} t1−2α 是临界值(分位数)。
2. 分析变量间的逻辑关系:
- 置信度 1 − α 1-\alpha 1−α 减小 ⟹ \implies ⟹ 显著性水平 α \alpha α 增大。
- 当 α \alpha α 增大时,分布两端尾部的面积增大,这意味着中间覆盖的面积减小。
- 对应的临界值 u 1 − α 2 u_{1-\frac{\alpha}{2}} u1−2α(或 t 1 − α 2 t_{1-\frac{\alpha}{2}} t1−2α)会随之减小。
3. 结论推导 :
由于置信区间长度 L L L 与临界值成正比,当临界值减小时,长度 L L L 也会随之变小。
直观理解:置信度代表我们对"参数落在区间内"的把握程度。如果我们降低要求的把握程度(从 95% 降低到 90%),我们就不需要那么宽的区间来保证准确性,因此区间会变窄。
答案 :A. 当 1 − α 1-\alpha 1−α 减小时, L L L 变小
题目9~11
9️⃣ 设样本 X 1 , X 2 , ⋯ , X n X_1, X_2, \cdots, X_n X1,X2,⋯,Xn 取自两点分布 b ( 1 , p ) b(1, p) b(1,p),其中 p p p 未知,则 ( 1 − p ) 2 (1 - p)^2 (1−p)2 的无偏估计的方差至少为 ( ) (\quad) ()
- A. 4 p 2 ( 1 − p ) n \frac{4p^2(1 - p)}{n} n4p2(1−p)
- B. 4 p ( 1 − p ) 3 n \frac{4p(1 - p)^3}{n} n4p(1−p)3 ✅
- C. 4 p ( 1 − p ) 2 n \frac{4p(1 - p)^2}{n} n4p(1−p)2
解析过程: 本题要求计算参数函数 g ( p ) = ( 1 − p ) 2 g(p) = (1 - p)^2 g(p)=(1−p)2 的无偏估计量的方差下界,即 Cramér-Rao (C-R) 下界。
1. 写出单样本的概率质量函数及其对数形式 :
对于两点分布 b ( 1 , p ) b(1, p) b(1,p),其概率质量函数为:
f ( x ; p ) = p x ( 1 − p ) 1 − x , x = 0 , 1 f(x; p) = p^x (1 - p)^{1-x}, \quad x = 0, 1 f(x;p)=px(1−p)1−x,x=0,1
取对数得:
ln f ( x ; p ) = x ln p + ( 1 − x ) ln ( 1 − p ) \ln f(x; p) = x \ln p + (1 - x) \ln(1 - p) lnf(x;p)=xlnp+(1−x)ln(1−p)
2. 计算单样本的 Fisher 信息量 I ( p ) I(p) I(p) :
对 p p p 求二阶导数:
- 一阶导数(评分函数): ∂ ln f ∂ p = x p − 1 − x 1 − p \frac{\partial \ln f}{\partial p} = \frac{x}{p} - \frac{1 - x}{1 - p} ∂p∂lnf=px−1−p1−x
- 二阶导数: ∂ 2 ln f ∂ p 2 = − x p 2 − 1 − x ( 1 − p ) 2 \frac{\partial^2 \ln f}{\partial p^2} = -\frac{x}{p^2} - \frac{1 - x}{(1 - p)^2} ∂p2∂2lnf=−p2x−(1−p)21−x
取负期望得到 I ( p ) I(p) I(p)(已知两点分布的期望 E ( X ) = p E(X) = p E(X)=p):
I ( p ) = − E [ ∂ 2 ln f ∂ p 2 ] = E ( X ) p 2 + 1 − E ( X ) ( 1 − p ) 2 = p p 2 + 1 − p ( 1 − p ) 2 = 1 p + 1 1 − p = 1 p ( 1 − p ) I(p) = -E\left[ \frac{\partial^2 \ln f}{\partial p^2} \right] = \frac{E(X)}{p^2} + \frac{1 - E(X)}{(1 - p)^2} = \frac{p}{p^2} + \frac{1 - p}{(1 - p)^2} = \frac{1}{p} + \frac{1}{1 - p} = \frac{1}{p(1 - p)} I(p)=−E[∂p2∂2lnf]=p2E(X)+(1−p)21−E(X)=p2p+(1−p)21−p=p1+1−p1=p(1−p)1
3. 确定待估参数函数 g ( p ) g(p) g(p) 及其导数的平方 :
已知 g ( p ) = ( 1 − p ) 2 g(p) = (1 - p)^2 g(p)=(1−p)2,对其求导得:
g ′ ( p ) = 2 ( 1 − p ) ⋅ ( − 1 ) = − 2 ( 1 − p ) g'(p) = 2(1 - p) \cdot (-1) = -2(1 - p) g′(p)=2(1−p)⋅(−1)=−2(1−p)
导数的平方为:
g ′ ( p ) \] 2 = 4 ( 1 − p ) 2 \[g'(p)\]\^2 = 4(1 - p)\^2 \[g′(p)\]2=4(1−p)2
4. **利用 C-R 不等式计算 n n n 个样本的方差下界** :
V a r ( g \^ ( p ) ) ≥ \[ g ′ ( p ) \] 2 n I ( p ) Var(\\hat{g}(p)) \\ge \\frac{\[g'(p)\]\^2}{n I(p)} Var(g\^(p))≥nI(p)\[g′(p)\]2
代入上述结果:
C R L B = 4 ( 1 − p ) 2 n ⋅ 1 p ( 1 − p ) = 4 ( 1 − p ) 2 ⋅ p ( 1 − p ) n = 4 p ( 1 − p ) 3 n CRLB = \\frac{4(1 - p)\^2}{n \\cdot \\frac{1}{p(1 - p)}} = \\frac{4(1 - p)\^2 \\cdot p(1 - p)}{n} = \\frac{4p(1 - p)\^3}{n} CRLB=n⋅p(1−p)14(1−p)2=n4(1−p)2⋅p(1−p)=n4p(1−p)3
*** ** * ** ***
**答案** :B. 4 p ( 1 − p ) 3 n \\frac{4p(1 - p)\^3}{n} n4p(1−p)3
*** ** * ** ***
*** ** * ** ***
> 1️⃣0️⃣ 有一大批糖果,现从中随机地取 16 袋,称得重量(以克计)如下:
>
> 506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496. 设袋装糖果的重量近似地服从正态分布,则总体均值的置信度为 0.95 的置信区间为 ( )
>
> * A. (500.4, 507.1) ✅
> * B. (495.3, 513.5)
*** ** * ** ***
**解析过程:** 这是一个关于正态总体均值 μ \\mu μ 的区间估计问题,且总体方差 σ 2 \\sigma\^2 σ2 未知,样本容量 n = 16 n = 16 n=16 为小样本,需使用 t t t 分布。
1. **计算样本均值 x ˉ \\bar{x} xˉ** :
x ˉ = 1 16 ∑ i = 1 16 x i = 8060 16 = 503.75 \\bar{x} = \\frac{1}{16} \\sum_{i=1}\^{16} x_i = \\frac{8060}{16} = 503.75 xˉ=161i=1∑16xi=168060=503.75
2. **计算样本标准差 s s s** :
通过公式 s = 1 n − 1 ∑ i = 1 n ( x i − x ˉ ) 2 s = \\sqrt{\\frac{1}{n-1} \\sum_{i=1}\^{n} (x_i - \\bar{x})\^2} s=n−11∑i=1n(xi−xˉ)2 计算:
∑ x i 2 = 506 2 + 508 2 + ⋯ + 496 2 = 4 , 060 , 802 \\sum x_i\^2 = 506\^2 + 508\^2 + \\dots + 496\^2 = 4,060,802 ∑xi2=5062+5082+⋯+4962=4,060,802
s = 4 , 060 , 802 − 16 ⋅ 503.75 2 15 ≈ 6.202 s = \\sqrt{\\frac{4,060,802 - 16 \\cdot 503.75\^2}{15}} \\approx 6.202 s=154,060,802−16⋅503.752 ≈6.202
3. **确定置信水平及分位数** :
置信度 1 − α = 0.95 1 - \\alpha = 0.95 1−α=0.95,则 α = 0.05 \\alpha = 0.05 α=0.05。
自由度 d f = n − 1 = 15 df = n - 1 = 15 df=n−1=15。查表得 t t t 分布的双侧临界值:
t α / 2 ( n − 1 ) = t 0.025 ( 15 ) ≈ 2.131 t_{\\alpha/2}(n-1) = t_{0.025}(15) \\approx 2.131 tα/2(n−1)=t0.025(15)≈2.131
4. **构造置信区间** :
置信区间公式为 \[ x ˉ ± s n t α / 2 ( n − 1 ) \] \\left\[ \\bar{x} \\pm \\frac{s}{\\sqrt{n}} t_{\\alpha/2}(n-1) \\right\] \[xˉ±n stα/2(n−1)\]:
* 误差限 d = 6.202 16 × 2.131 = 1.5505 × 2.131 ≈ 3.304 d = \\frac{6.202}{\\sqrt{16}} \\times 2.131 = 1.5505 \\times 2.131 \\approx 3.304 d=16 6.202×2.131=1.5505×2.131≈3.304
* 下限: 503.75 − 3.304 = 500.446 503.75 - 3.304 = 500.446 503.75−3.304=500.446
* 上限: 503.75 + 3.304 = 507.054 503.75 + 3.304 = 507.054 503.75+3.304=507.054
**结论**:对应的置信区间约为 (500.4, 507.1)。
*** ** * ** ***
**答案**:A. (500.4, 507.1)
*** ** * ** ***
> 1️⃣1️⃣ 置信区间的置信度是指:
>
> * A. 置信区间包含参数真实值的概率 ✅
> * B. 区间长度
**答案:** A. 置信区间包含参数真实值的概率
*** ** * ** ***
### 题目12~13
> 1️⃣2️⃣ 设 X 1 , X 2 , ⋯ , X n X_1, X_2, \\cdots, X_n X1,X2,⋯,Xn 是正态总体 N ( μ , σ 2 ) N(\\mu, \\sigma\^2) N(μ,σ2) 的样本,其中 μ , σ 2 \\mu, \\sigma\^2 μ,σ2 都是未知参数,则 μ \\mu μ 的置信水平为 1 − α 1-\\alpha 1−α 的单侧置信下限为 ________ (结果用分位数表示).
>
> * A. X ˉ − t 1 − α 2 ( n − 1 ) S n \\bar{X} - t_{1-\\frac{\\alpha}{2}}(n-1) \\frac{S}{\\sqrt{n}} Xˉ−t1−2α(n−1)n S
> * B. X ˉ − t 1 − α ( n − 1 ) S n \\bar{X} - t_{1-\\alpha}(n-1) \\frac{S}{\\sqrt{n}} Xˉ−t1−α(n−1)n S ✅
> * C. X ˉ − t 1 − α 2 ( n ) S n \\bar{X} - t_{1-\\frac{\\alpha}{2}}(n) \\frac{S}{\\sqrt{n}} Xˉ−t1−2α(n)n S
> * D. X ˉ − t 1 − α ( n − 1 ) σ n \\bar{X} - t_{1-\\alpha}(n-1) \\frac{\\sigma}{\\sqrt{n}} Xˉ−t1−α(n−1)n σ
*** ** * ** ***
**解析过程:**
1. **选择统计量** :
由于总体方差 σ 2 \\sigma\^2 σ2 未知,构造含有待估参数 μ \\mu μ 的 t t t 统计量:
T = X ˉ − μ S / n ∼ t ( n − 1 ) T = \\frac{\\bar{X} - \\mu}{S / \\sqrt{n}} \\sim t(n-1) T=S/n Xˉ−μ∼t(n−1)
其中 X ˉ \\bar{X} Xˉ 是样本均值, S S S 是样本标准差。
2. **确定分位数定义** :
根据前序题目(如题目7)的定义, x α x_\\alpha xα 满足 P { X \< x α } = α P\\{X \< x_\\alpha\\} = \\alpha P{X\
1. 写出对数似然函数 :
对 f ( x , θ ) f(x, \theta) f(x,θ) 取自然对数:
ln f ( x ; θ ) = ln ( 2 θ x 3 e − θ x 2 ) \ln f(x; \theta) = \ln \left( \frac{2\theta}{x^3} e^{-\frac{\theta}{x^2}} \right) lnf(x;θ)=ln(x32θe−x2θ)
ln f ( x ; θ ) = ln 2 + ln θ − 3 ln x − θ x 2 \ln f(x; \theta) = \ln 2 + \ln \theta - 3 \ln x - \frac{\theta}{x^2} lnf(x;θ)=ln2+lnθ−3lnx−x2θ
2. 求关于参数 θ \theta θ 的一阶导数(评分函数) :
∂ ln f ( x ; θ ) ∂ θ = 1 θ − 1 x 2 \frac{\partial \ln f(x; \theta)}{\partial \theta} = \frac{1}{\theta} - \frac{1}{x^2} ∂θ∂lnf(x;θ)=θ1−x21
3. 求关于参数 θ \theta θ 的二阶导数 :
∂ 2 ln f ( x ; θ ) ∂ θ 2 = ∂ ∂ θ ( 1 θ − 1 x 2 ) = − 1 θ 2 \frac{\partial^2 \ln f(x; \theta)}{\partial \theta^2} = \frac{\partial}{\partial \theta} \left( \frac{1}{\theta} - \frac{1}{x^2} \right) = -\frac{1}{\theta^2} ∂θ2∂2lnf(x;θ)=∂θ∂(θ1−x21)=−θ21
4. 计算 Fisher 信息量 :
由于二阶导数 − 1 θ 2 -\frac{1}{\theta^2} −θ21 是一个常数(不依赖于随机变量 X X X),其期望即为其本身:
I ( θ ) = − E [ − 1 θ 2 ] = 1 θ 2 I(\theta) = -E\left[ -\frac{1}{\theta^2} \right] = \frac{1}{\theta^2} I(θ)=−E[−θ21]=θ21
答案 :B. 1 θ 2 \frac{1}{\theta^2} θ21
三、填空题
题目14
1️⃣4️⃣ 在稳定生产的情况下,某工厂生产的电灯泡使用时数可认为服从正态分布。观察 20 个灯泡的使用时数,测得其平均寿命为 1832 小时,标准差为 497 小时。试构造灯泡使用寿命的总体平均值 95% 的置信区间。(保留一位小数)
第 1 空:________________
解析过程:
1. 识别已知条件:
- 样本容量 n = 20 n = 20 n=20
- 样本均值 x ˉ = 1832 \bar{x} = 1832 xˉ=1832
- 样本标准差 s = 497 s = 497 s=497
- 置信水平 1 − α = 0.95 1 - \alpha = 0.95 1−α=0.95,则 α = 0.05 \alpha = 0.05 α=0.05
2. 选择统计量 :
由于总体方差 σ 2 \sigma^2 σ2 未知,且总体服从正态分布,应使用 t t t 分布构造置信区间:
x ˉ − μ s / n ∼ t ( n − 1 ) \frac{\bar{x} - \mu}{s / \sqrt{n}} \sim t(n-1) s/n xˉ−μ∼t(n−1)
3. 确定临界值 :
自由度 d f = n − 1 = 19 df = n - 1 = 19 df=n−1=19。查表(或计算)得 t t t 分布的双侧临界值 t α / 2 ( 19 ) t_{\alpha/2}(19) tα/2(19):
t 0.025 ( 19 ) ≈ 2.093 t_{0.025}(19) \approx 2.093 t0.025(19)≈2.093
4. 计算误差限(置信半径) E E E :
E = t α / 2 ( n − 1 ) ⋅ s n = 2.093 ⋅ 497 20 E = t_{\alpha/2}(n-1) \cdot \frac{s}{\sqrt{n}} = 2.093 \cdot \frac{497}{\sqrt{20}} E=tα/2(n−1)⋅n s=2.093⋅20 497
E ≈ 2.093 ⋅ 497 4.472 ≈ 2.093 ⋅ 111.13 ≈ 232.6 E \approx 2.093 \cdot \frac{497}{4.472} \approx 2.093 \cdot 111.13 \approx 232.6 E≈2.093⋅4.472497≈2.093⋅111.13≈232.6
5. 计算置信区间 [ x ˉ − E , x ˉ + E ] [\bar{x} - E, \bar{x} + E] [xˉ−E,xˉ+E]:
- 下限: 1832 − 232.6 = 1599.4 1832 - 232.6 = 1599.4 1832−232.6=1599.4
- 上限: 1832 + 232.6 = 2064.6 1832 + 232.6 = 2064.6 1832+232.6=2064.6
结论 :总体平均值的 95% 置信区间为 ( 1599.4 , 2064.6 ) (1599.4, 2064.6) (1599.4,2064.6)。
答案:(1599.4, 2064.6)
四、多选题
题目15
1️⃣5️⃣ 关于参数的置信度为 90% 的置信区间,以下正确的是
- A. 参数是固定的常数,没有随机性 ✅
- B. 置信区间是随机区间,随样本的不同而变化 ✅
- C. 随机区间以 90% 的概率包含参数 ✅
- D. 参数是变化的,其落在置信区间内的概率为 90%
解析过程:
- 频率学派观点 (A/B):在经典统计中,待估参数是一个固定值,随机性来自于样本及其生成的区间。
- 置信水平定义 ©:置信度为 90% 意味着如果我们进行 100 次独立的实验并构造区间,大约有 90 个区间会包含真实参数。
- 错误辨析 (D):参数本身不变化,也不存在"落在"区间的说法(因为它是固定的),而是区间"覆盖"参数。
答案:ABC