【TJU】应用统计学------第六周作业(3.3 两个正态总体参数的假设检验、3.4 非正态总体参数的假设检验、4.1 一元线性回归分析)
一、单选题
题目1~3
1️⃣ 考虑线性回归模型:
Y 1 = θ 1 + ε 1 Y 2 = 2 θ 1 − θ 2 + ε 2 Y 3 = θ 1 + 2 θ 2 + ε 3 Y_1=\theta_1+\varepsilon_1 \\ Y_2=2\theta_1-\theta_2+\varepsilon_2 \\ Y_3=\theta_1+2\theta_2+\varepsilon_3 Y1=θ1+ε1Y2=2θ1−θ2+ε2Y3=θ1+2θ2+ε3
其中 E ( ε i ) = 0 , E ( ε i ε j ) = 0 ( i ≠ j ) E(\varepsilon_i)=0,\ E(\varepsilon_i\varepsilon_j)=0(i\ne j) E(εi)=0, E(εiεj)=0(i=j),则 θ 1 \theta_1 θ1 和 θ 2 \theta_2 θ2 最小二乘估计为( )
- A. θ ^ 1 = 1 3 y 1 + 1 6 y 2 + 1 3 y 3 ; θ ^ 2 = 1 3 y 2 + 1 3 y 3 \hat{\theta}_1=\dfrac{1}{3}y_1+\dfrac{1}{6}y_2+\dfrac{1}{3}y_3;\ \hat{\theta}_2=\dfrac{1}{3}y_2+\dfrac{1}{3}y_3 θ^1=31y1+61y2+31y3; θ^2=31y2+31y3
- B. θ ^ 1 = 1 6 y 1 + 1 6 y 2 + 1 3 y 3 ; θ ^ 2 = 1 5 y 2 + 2 5 y 3 \hat{\theta}_1=\dfrac{1}{6}y_1+\dfrac{1}{6}y_2+\dfrac{1}{3}y_3;\ \hat{\theta}_2=\dfrac{1}{5}y_2+\dfrac{2}{5}y_3 θ^1=61y1+61y2+31y3; θ^2=51y2+52y3
- C. θ ^ 1 = 1 6 y 1 + 1 3 y 2 + 1 6 y 3 ; θ ^ 2 = − 1 5 y 2 + 2 5 y 3 \hat{\theta}_1=\dfrac{1}{6}y_1+\dfrac{1}{3}y_2+\dfrac{1}{6}y_3;\ \hat{\theta}_2=-\dfrac{1}{5}y_2+\dfrac{2}{5}y_3 θ^1=61y1+31y2+61y3; θ^2=−51y2+52y3 ✅
- D. θ ^ 1 = 1 6 y 1 + 1 3 y 2 + 1 3 y 3 ; θ ^ 2 = 1 5 y 1 + 2 5 y 2 \hat{\theta}_1=\dfrac{1}{6}y_1+\dfrac{1}{3}y_2+\dfrac{1}{3}y_3;\ \hat{\theta}_2=\dfrac{1}{5}y_1+\dfrac{2}{5}y_2 θ^1=61y1+31y2+31y3; θ^2=51y1+52y2
设 Y = X θ + ε Y=X\theta+\varepsilon Y=Xθ+ε,则该题的设计矩阵为
X = [ 1 0 2 − 1 1 2 ] , θ = [ θ 1 θ 2 ] , Y = [ y 1 y 2 y 3 ] X= \begin{bmatrix} 1 & 0 \\ 2 & -1 \\ 1 & 2 \end{bmatrix}, \qquad \theta= \begin{bmatrix} \theta_1 \\ \theta_2 \end{bmatrix}, \qquad Y= \begin{bmatrix} y_1 \\ y_2 \\ y_3 \end{bmatrix} X= 1210−12 ,θ=[θ1θ2],Y= y1y2y3
由最小二乘估计公式 θ ^ = ( X T X ) − 1 X T Y \hat{\theta}=(X^\mathrm{T}X)^{-1}X^\mathrm{T}Y θ^=(XTX)−1XTY,先计算
X T X = [ 1 2 1 0 − 1 2 ] [ 1 0 2 − 1 1 2 ] = [ 6 0 0 5 ] X^\mathrm{T}X= \begin{bmatrix} 1 & 2 & 1 \\ 0 & -1 & 2 \end{bmatrix} \begin{bmatrix} 1 & 0 \\ 2 & -1 \\ 1 & 2 \end{bmatrix}= \begin{bmatrix} 6 & 0 \\ 0 & 5 \end{bmatrix} XTX=[102−112] 1210−12 =[6005]
因此
( X T X ) − 1 = [ 1 6 0 0 1 5 ] (X^\mathrm{T}X)^{-1}= \begin{bmatrix} \dfrac{1}{6} & 0 \\ 0 & \dfrac{1}{5} \end{bmatrix} (XTX)−1= 610051
再计算
X T Y = [ 1 2 1 0 − 1 2 ] [ y 1 y 2 y 3 ] = [ y 1 + 2 y 2 + y 3 − y 2 + 2 y 3 ] X^\mathrm{T}Y= \begin{bmatrix} 1 & 2 & 1 \\ 0 & -1 & 2 \end{bmatrix} \begin{bmatrix} y_1 \\ y_2 \\ y_3 \end{bmatrix}= \begin{bmatrix} y_1+2y_2+y_3 \\ -y_2+2y_3 \end{bmatrix} XTY=[102−112] y1y2y3 =[y1+2y2+y3−y2+2y3]
所以
θ ^ = [ 1 6 0 0 1 5 ] [ y 1 + 2 y 2 + y 3 − y 2 + 2 y 3 ] = [ 1 6 y 1 + 1 3 y 2 + 1 6 y 3 − 1 5 y 2 + 2 5 y 3 ] \hat{\theta}= \begin{bmatrix} \dfrac{1}{6} & 0 \\ 0 & \dfrac{1}{5} \end{bmatrix} \begin{bmatrix} y_1+2y_2+y_3 \\ -y_2+2y_3 \end{bmatrix}= \begin{bmatrix} \dfrac{1}{6}y_1+\dfrac{1}{3}y_2+\dfrac{1}{6}y_3 \\ -\dfrac{1}{5}y_2+\dfrac{2}{5}y_3 \end{bmatrix} θ^= 610051 [y1+2y2+y3−y2+2y3]= 61y1+31y2+61y3−51y2+52y3
因此
θ ^ 1 = 1 6 y 1 + 1 3 y 2 + 1 6 y 3 \hat{\theta}_1=\dfrac{1}{6}y_1+\dfrac{1}{3}y_2+\dfrac{1}{6}y_3 θ^1=61y1+31y2+61y3
θ ^ 2 = − 1 5 y 2 + 2 5 y 3 \hat{\theta}_2=-\dfrac{1}{5}y_2+\dfrac{2}{5}y_3 θ^2=−51y2+52y3
所以对应选项 C。
答案:C
2️⃣ 设 Y 1 Y_1 Y1 和 Y 2 Y_2 Y2 是独立的随机变量,且 E ( Y 1 ) = θ , E ( Y 2 ) = 2 θ E(Y_1)=\theta,\ E(Y_2)=2\theta E(Y1)=θ, E(Y2)=2θ,则 θ \theta θ 的最小二乘估计为( )
- A. θ ^ = 1 3 y 1 + 2 3 y 2 \hat{\theta}=\dfrac{1}{3}y_1+\dfrac{2}{3}y_2 θ^=31y1+32y2
- B. θ ^ = 1 5 y 1 + 2 5 y 2 \hat{\theta}=\dfrac{1}{5}y_1+\dfrac{2}{5}y_2 θ^=51y1+52y2 ✅
- C. θ ^ = − 1 5 y 1 + 2 5 y 2 \hat{\theta}=-\dfrac{1}{5}y_1+\dfrac{2}{5}y_2 θ^=−51y1+52y2
- D. θ ^ = 1 2 y 1 + 1 2 y 2 \hat{\theta}=\dfrac{1}{2}y_1+\dfrac{1}{2}y_2 θ^=21y1+21y2
由题意可将模型写成: Y 1 = θ + ε 1 , Y 2 = 2 θ + ε 2 Y_1=\theta+\varepsilon_1,\qquad Y_2=2\theta+\varepsilon_2 Y1=θ+ε1,Y2=2θ+ε2
写成矩阵形式就是: Y = X θ + ε Y=X\theta+\varepsilon Y=Xθ+ε,其中 X = [ 1 2 ] , Y = [ y 1 y 2 ] X=\begin{bmatrix}1\\2\end{bmatrix},\qquad Y=\begin{bmatrix}y_1\\y_2\end{bmatrix} X=[12],Y=[y1y2]
由最小二乘估计公式 θ ^ = ( X T X ) − 1 X T Y \hat{\theta}=(X^\mathrm{T}X)^{-1}X^\mathrm{T}Y θ^=(XTX)−1XTY
先计算
X T X = 1 2 + 2 2 = 5 X^\mathrm{T}X=1^2+2^2=5 XTX=12+22=5
再计算
X T Y = y 1 + 2 y 2 X^\mathrm{T}Y=y_1+2y_2 XTY=y1+2y2
因此
θ ^ = 1 5 ( y 1 + 2 y 2 ) = 1 5 y 1 + 2 5 y 2 \hat{\theta}=\frac{1}{5}(y_1+2y_2)=\dfrac{1}{5}y_1+\dfrac{2}{5}y_2 θ^=51(y1+2y2)=51y1+52y2
所以对应选项 B。
答案:B
3️⃣ 利用回归方程对相应变量预测,对给定的样本和显著性水平, S x x S_{xx} Sxx 越__________,预测区间的长度就越短。
- A. 大 ✅
- B. 小
在线性回归中,预测区间长度与预测误差有关,而预测误差中包含一项
( x 0 − x ˉ ) 2 S x x \frac{(x_0-\bar{x})^2}{S_{xx}} Sxx(x0−xˉ)2
其中
S x x = ∑ i = 1 n ( x i − x ˉ ) 2 S_{xx}=\sum_{i=1}^n(x_i-\bar{x})^2 Sxx=i=1∑n(xi−xˉ)2
对给定样本和显著性水平来说,若 S x x S_{xx} Sxx 越大,那么上式就越小,从而预测标准误越小,最终预测区间长度也就越短。
也就是说,样本中自变量取值越分散,回归预测通常越稳定,区间越短。
答案:A. 大
题目4~5
4️⃣ 设总体 X ∼ N ( μ 1 , σ 1 2 ) X\sim N(\mu_1,\sigma_1^2) X∼N(μ1,σ12), X 1 , X 2 , ⋯ , X n 1 X_1,X_2,\cdots,X_{n_1} X1,X2,⋯,Xn1 是来自 X X X 的简单随机样本;总体 Y ∼ N ( μ 2 , σ 2 2 ) Y\sim N(\mu_2,\sigma_2^2) Y∼N(μ2,σ22), Y 1 , Y 2 , ⋯ , Y n 2 Y_1,Y_2,\cdots,Y_{n_2} Y1,Y2,⋯,Yn2 是来自 Y Y Y 的简单随机样本,且 μ 1 , μ 2 , σ 1 2 , σ 2 2 \mu_1,\mu_2,\sigma_1^2,\sigma_2^2 μ1,μ2,σ12,σ22 均未知,两总体相互独立。令 F 1 = ( n 2 − 1 ) ∑ ( X i − X ˉ ) 2 ( n 1 − 1 ) ∑ ( Y i − Y ˉ ) 2 , F 2 = n 2 ∑ ( X i − μ 1 ) 2 n 1 ∑ ( Y i − μ 2 ) 2 F_1=\frac{(n_2-1)\sum (X_i-\bar{X})^2}{(n_1-1)\sum (Y_i-\bar{Y})^2}, \qquad F_2=\frac{n_2\sum (X_i-\mu_1)^2}{n_1\sum (Y_i-\mu_2)^2} F1=(n1−1)∑(Yi−Yˉ)2(n2−1)∑(Xi−Xˉ)2,F2=n1∑(Yi−μ2)2n2∑(Xi−μ1)2,则显著性水平 α \alpha α 的假设检验 H 0 : σ 1 2 ≥ σ 2 2 , H 1 : σ 1 2 < σ 2 2 H_0:\sigma_1^2\ge \sigma_2^2,\ H_1:\sigma_1^2<\sigma_2^2 H0:σ12≥σ22, H1:σ12<σ22 的拒绝域为( )
- A. W = { F 1 < F α ( n 1 − 1 , n 2 − 1 ) } W=\{F_1<F_\alpha(n_1-1,n_2-1)\} W={F1<Fα(n1−1,n2−1)} ✅
- B. W = { F 1 < F α ( n 1 , n 2 ) } W=\{F_1<F_\alpha(n_1,n_2)\} W={F1<Fα(n1,n2)}
- C. W = { F 2 < F α ( n 1 − 1 , n 2 − 1 ) } W=\{F_2<F_\alpha(n_1-1,n_2-1)\} W={F2<Fα(n1−1,n2−1)}
- D. W = { F 2 < F α ( n 1 , n 2 ) } W=\{F_2<F_\alpha(n_1,n_2)\} W={F2<Fα(n1,n2)}
这道题考查的是两个正态总体方差的比较检验。
由于总体均值 μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2 都未知,因此应使用样本方差构造统计量,而不是使用含总体均值的 F 2 F_2 F2。也就是说,应该选用
F 1 = S X 2 S Y 2 F_1=\frac{S_X^2}{S_Y^2} F1=SY2SX2
其中
S X 2 = 1 n 1 − 1 ∑ i = 1 n 1 ( X i − X ˉ ) 2 , S Y 2 = 1 n 2 − 1 ∑ i = 1 n 2 ( Y i − Y ˉ ) 2 S_X^2=\frac{1}{n_1-1}\sum_{i=1}^{n_1}(X_i-\bar{X})^2, \qquad S_Y^2=\frac{1}{n_2-1}\sum_{i=1}^{n_2}(Y_i-\bar{Y})^2 SX2=n1−11i=1∑n1(Xi−Xˉ)2,SY2=n2−11i=1∑n2(Yi−Yˉ)2
因此在原假设边界 σ 1 2 = σ 2 2 \sigma_1^2=\sigma_2^2 σ12=σ22 下,有
F 1 = S X 2 S Y 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F_1=\frac{S_X^2}{S_Y^2}\sim F(n_1-1,n_2-1) F1=SY2SX2∼F(n1−1,n2−1)
又因为备择假设是
H 1 : σ 1 2 < σ 2 2 H_1:\sigma_1^2<\sigma_2^2 H1:σ12<σ22
说明我们要检验的是"前者方差小于后者方差",所以当比值
S X 2 S Y 2 \frac{S_X^2}{S_Y^2} SY2SX2
取得较小值时,更倾向于拒绝 H 0 H_0 H0。因此这是一个 左侧检验,拒绝域应写成
W = { F 1 < F α ( n 1 − 1 , n 2 − 1 ) } W=\{F_1<F_\alpha(n_1-1,n_2-1)\} W={F1<Fα(n1−1,n2−1)}
所以对应选项 A。
答案:A
5️⃣ 设总体 X ∼ N ( μ 1 , σ 1 2 ) X\sim N(\mu_1,\sigma_1^2) X∼N(μ1,σ12),总体 Y ∼ N ( μ 2 , σ 2 2 ) Y\sim N(\mu_2,\sigma_2^2) Y∼N(μ2,σ22),从两个总体中分别独立抽取样本 X 1 , X 2 , ⋯ , X n 1 X_1,X_2,\cdots,X_{n_1} X1,X2,⋯,Xn1 和 Y 1 , Y 2 , ⋯ , Y n 2 Y_1,Y_2,\cdots,Y_{n_2} Y1,Y2,⋯,Yn2。已知 σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2,欲检验 H 0 : μ 1 − μ 2 = δ H_0:\mu_1-\mu_2=\delta H0:μ1−μ2=δ,其中 δ \delta δ 为已知常数,则应选择的检验统计量为( )
- A. Z = ( X ‾ − Y ‾ ) − δ σ 1 2 n 1 + σ 2 2 n 2 Z=\dfrac{(\overline{X}-\overline{Y})-\delta}{\sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}}} Z=n1σ12+n2σ22 (X−Y)−δ ✅
- B. T = ( X ‾ − Y ‾ ) − δ S w 1 n 1 + 1 n 2 T=\dfrac{(\overline{X}-\overline{Y})-\delta}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}} T=Swn11+n21 (X−Y)−δ
- C. F = S 1 2 S 2 2 F=\dfrac{S_1^2}{S_2^2} F=S22S12
- D. T = X ‾ − μ 0 S / n T=\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}} T=S/n X−μ0
这道题考查的是两个正态总体均值差的假设检验。
由于题目已经给出两个总体满足
σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2
也就是说总体方差是已知的,因此在检验 H 0 : μ 1 − μ 2 = δ H_0:\mu_1-\mu_2=\delta H0:μ1−μ2=δ 时,应采用两个总体均值差的 Z 检验统计量:
Z = ( X ‾ − Y ‾ ) − δ σ 1 2 n 1 + σ 2 2 n 2 Z=\frac{(\overline{X}-\overline{Y})-\delta}{\sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}}} Z=n1σ12+n2σ22 (X−Y)−δ
若题目说的是"方差未知但相等",那才应使用合并方差构造的 t t t 统计量,也就是选项 B 的形式。
选项 C 是方差比检验用的统计量,选项 D 是单总体均值检验的统计量,都不符合本题条件。
这道题系统标准答案按 方差未知但相等 的情形处理,因此应选择合并方差的两独立样本 t t t 检验统计量。
也就是说,本题应采用
T = ( X ‾ − Y ‾ ) − δ S w 1 n 1 + 1 n 2 T=\frac{(\overline{X}-\overline{Y})-\delta}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}} T=Swn11+n21 (X−Y)−δ
其中
S w 2 = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_w^2=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} Sw2=n1+n2−2(n1−1)S12+(n2−1)S22
因此对应选项 B。
严格从统计学表述看,题干里的 σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2 更像是在说明"两总体方差相等",并不一定表示这个公共方差数值已知。若公共方差未知但相等,就应使用合并方差的 t t t 检验,这也与学习通给出的标准答案一致。
只有在"总体方差已知"被明确说明时,才通常使用
Z = ( X ‾ − Y ‾ ) − δ σ 1 2 n 1 + σ 2 2 n 2 Z=\frac{(\overline{X}-\overline{Y})-\delta}{\sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}}} Z=n1σ12+n2σ22 (X−Y)−δ
选项 C 是方差比检验用的统计量,选项 D 是单总体均值检验的统计量,都不符合本题条件。
所以本题按课程和平台标准答案,应选 B。
答案:B
二、填空题
题目6~8
6️⃣ 炼铝厂测得所产铸模用的铝的硬度 x x x 与抗张强度 y y y 数据如下:
x i : 68 , 53 , 70 , 84 , 60 , 72 , 51 , 83 , 70 , 64 y i : 288 , 293 , 349 , 343 , 290 , 354 , 283 , 324 , 340 , 286 x_i:\ 68,\ 53,\ 70,\ 84,\ 60,\ 72,\ 51,\ 83,\ 70,\ 64 \\ y_i:\ 288,\ 293,\ 349,\ 343,\ 290,\ 354,\ 283,\ 324,\ 340,\ 286 xi: 68, 53, 70, 84, 60, 72, 51, 83, 70, 64yi: 288, 293, 349, 343, 290, 354, 283, 324, 340, 286
则由该数据计算得 x ˉ = ‾ , y ˉ = ‾ , S x x = ‾ , S x y = ‾ , S y y = ‾ \bar{x}= \underline{\qquad},\quad \bar{y}= \underline{\qquad},\quad S_{xx}= \underline{\qquad},\quad S_{xy}= \underline{\qquad},\quad S_{yy}= \underline{\qquad} xˉ=,yˉ=,Sxx=,Sxy=,Syy=
回归系数 β ^ 0 = ‾ ( a : 166.5 ; b : 188.78 ; c : 189.68 ) \hat{\beta}_0=\underline{\qquad}\quad (a:166.5;\ b:188.78;\ c:189.68) β^0=(a:166.5; b:188.78; c:189.68), β ^ 1 = ‾ ( a : 1.87 ; b : 1.67 ; c : 1.56 ) \hat{\beta}_1=\underline{\qquad}\quad (a:1.87;\ b:1.67;\ c:1.56) β^1=(a:1.87; b:1.67; c:1.56)
对回归方程进行显著性检验时, F F F 统计量的值是 ‾ \underline{\qquad} ,查表得 F F F 分位数的值是 ‾ \underline{\qquad} ,
检验结果认为回归方程 ‾ \underline{\qquad} (填显著或不显著)。(结果如有必要,保留两位小数, α = 0.05 \alpha=0.05 α=0.05)
先计算样本均值: x ˉ = 68 + 53 + 70 + 84 + 60 + 72 + 51 + 83 + 70 + 64 10 = 67.5 \bar{x}=\frac{68+53+70+84+60+72+51+83+70+64}{10}=67.5 xˉ=1068+53+70+84+60+72+51+83+70+64=67.5, y ˉ = 288 + 293 + 349 + 343 + 290 + 354 + 283 + 324 + 340 + 286 10 = 315 \bar{y}=\frac{288+293+349+343+290+354+283+324+340+286}{10}=315 yˉ=10288+293+349+343+290+354+283+324+340+286=315
再计算离差平方和与离差乘积和:
S x x = ∑ ( x i − x ˉ ) 2 = 1096.5 S_{xx}=\sum (x_i-\bar{x})^2=1096.5 Sxx=∑(xi−xˉ)2=1096.5
S x y = ∑ ( x i − x ˉ ) ( y i − y ˉ ) = 2047 S_{xy}=\sum (x_i-\bar{x})(y_i-\bar{y})=2047 Sxy=∑(xi−xˉ)(yi−yˉ)=2047
S y y = ∑ ( y i − y ˉ ) 2 = 7870 S_{yy}=\sum (y_i-\bar{y})^2=7870 Syy=∑(yi−yˉ)2=7870
一元线性回归模型中,回归系数估计公式为
β ^ 1 = S x y S x x , β ^ 0 = y ˉ − β ^ 1 x ˉ \hat{\beta}1=\frac{S{xy}}{S_{xx}},\qquad \hat{\beta}_0=\bar{y}-\hat{\beta}_1\bar{x} β^1=SxxSxy,β^0=yˉ−β^1xˉ
因此
β ^ 1 = 2047 1096.5 ≈ 1.87 \hat{\beta}_1=\frac{2047}{1096.5}\approx 1.87 β^1=1096.52047≈1.87
β ^ 0 = 315 − 1.86685 × 67.5 ≈ 188.99 \hat{\beta}_0=315-1.86685\times 67.5\approx 188.99 β^0=315−1.86685×67.5≈188.99
结合题目给出的备选值, β ^ 0 \hat{\beta}_0 β^0 应选最接近的 189.68 ,即选 c ; β ^ 1 \hat{\beta}_1 β^1 选 1.87 ,即选 a。
下面进行回归方程显著性检验。先计算
S S R = S x y 2 S x x = 2047 2 1096.5 ≈ 3821.44 SSR=\frac{S_{xy}^2}{S_{xx}}=\frac{2047^2}{1096.5}\approx 3821.44 SSR=SxxSxy2=1096.520472≈3821.44
S S E = S y y − S S R = 7870 − 3821.44 = 4048.56 SSE=S_{yy}-SSR=7870-3821.44=4048.56 SSE=Syy−SSR=7870−3821.44=4048.56
所以
F = S S R / 1 S S E / ( n − 2 ) = 3821.44 4048.56 / 8 ≈ 7.55 F=\frac{SSR/1}{SSE/(n-2)}=\frac{3821.44}{4048.56/8}\approx 7.55 F=SSE/(n−2)SSR/1=4048.56/83821.44≈7.55
由于这是一元线性回归显著性检验,自由度为 ( 1 , 8 ) (1,8) (1,8),在显著性水平 α = 0.05 \alpha=0.05 α=0.05 下,
F 0.05 ( 1 , 8 ) ≈ 5.32 F_{0.05}(1,8)\approx 5.32 F0.05(1,8)≈5.32
因为
7.55 > 5.32 7.55>5.32 7.55>5.32
所以拒绝原假设,认为回归方程 显著。
答案:
x ˉ = 67.5 \bar{x}=67.5 xˉ=67.5, y ˉ = 315 \bar{y}=315 yˉ=315, S x x = 1096.5 S_{xx}=1096.5 Sxx=1096.5, S x y = 2047 S_{xy}=2047 Sxy=2047, S y y = 7870 S_{yy}=7870 Syy=7870
β ^ 0 = 188.78 ( b ) \hat{\beta}_0=188.78\ (b) β^0=188.78 (b), β ^ 1 = 1.87 ( a ) \hat{\beta}_1=1.87\ (a) β^1=1.87 (a)
F = 7.6 F=7.6 F=7.6, F F F 分位数 = 5.32 =5.32 =5.32
回归方程:显著
7️⃣ 下表列出了在悬挂不同质量(单位:克)时弹簧的长度(单位:厘米): x i : 5 , 10 , 15 , 20 , 25 , 30 y i : 7.25 , 8.12 , 8.95 , 9.90 , 10.9 , 11.8 x_i:\ 5,\ 10,\ 15,\ 20,\ 25,\ 30 \\ y_i:\ 7.25,\ 8.12,\ 8.95,\ 9.90,\ 10.9,\ 11.8 xi: 5, 10, 15, 20, 25, 30yi: 7.25, 8.12, 8.95, 9.90, 10.9, 11.8
则由该数据计算得: x ˉ = ‾ , y ˉ = ‾ , S x x = ‾ , S x y = ‾ , S y y = ‾ \bar{x}= \underline{\qquad},\quad \bar{y}= \underline{\qquad},\quad S_{xx}= \underline{\qquad},\quad S_{xy}= \underline{\qquad},\quad S_{yy}= \underline{\qquad} xˉ=,yˉ=,Sxx=,Sxy=,Syy=
回归方程为 y ^ = β ^ 0 + β ^ 1 x \hat{y}=\hat{\beta}_0+\hat{\beta}_1x y^=β^0+β^1x,其中系数 β ^ 0 = ‾ , β ^ 1 = ‾ \hat{\beta}_0=\underline{\qquad},\qquad\hat{\beta}_1=\underline{\qquad} β^0=,β^1=
对回归方程进行显著性检验,设 H 0 : β 1 = 0 , H 1 : β 1 ≠ 0 H_0:\beta_1=0,\ H_1:\beta_1\ne 0 H0:β1=0, H1:β1=0,已知 F = ( n − 2 ) U Q e = 446 , F 0.95 ( 1 , 4 ) = 7.71 F=(n-2)\frac{U}{Q_e}=446,\qquad F_{0.95}(1,4)=7.71 F=(n−2)QeU=446,F0.95(1,4)=7.71
检验结果拒绝 H 0 H_0 H0,认为回归方程显著。
先计算样本均值: x ˉ = 5 + 10 + 15 + 20 + 25 + 30 6 = 17.5 y ˉ = 7.25 + 8.12 + 8.95 + 9.90 + 10.9 + 11.8 6 = 9.4867 ≈ 9.49 \bar{x}=\frac{5+10+15+20+25+30}{6}=17.5 \\ \bar{y}=\frac{7.25+8.12+8.95+9.90+10.9+11.8}{6}=9.4867\approx 9.49 xˉ=65+10+15+20+25+30=17.5yˉ=67.25+8.12+8.95+9.90+10.9+11.8=9.4867≈9.49
再计算离差平方和与离差乘积和: S x x = ∑ ( x i − x ˉ ) 2 = 437.5 S x y = ∑ ( x i − x ˉ ) ( y i − y ˉ ) = 80.10 S y y = ∑ ( y i − y ˉ ) 2 = 14.68 S_{xx}=\sum (x_i-\bar{x})^2=437.5 \\ S_{xy}=\sum (x_i-\bar{x})(y_i-\bar{y})=80.10 \\ S_{yy}=\sum (y_i-\bar{y})^2=14.68 Sxx=∑(xi−xˉ)2=437.5Sxy=∑(xi−xˉ)(yi−yˉ)=80.10Syy=∑(yi−yˉ)2=14.68
由一元线性回归系数公式 β ^ 1 = S x y S x x , β ^ 0 = y ˉ − β ^ 1 x ˉ \hat{\beta}1=\frac{S{xy}}{S_{xx}},\qquad \hat{\beta}_0=\bar{y}-\hat{\beta}_1\bar{x} β^1=SxxSxy,β^0=yˉ−β^1xˉ
可得: β ^ 1 = 80.10 437.5 ≈ 0.1831 ≈ 0.18 β ^ 0 = 9.4867 − 0.1831 × 17.5 ≈ 6.2827 ≈ 6.28 \hat{\beta}_1=\frac{80.10}{437.5}\approx 0.1831\approx 0.18 \\ \hat{\beta}_0=9.4867-0.1831\times 17.5\approx 6.2827\approx 6.28 β^1=437.580.10≈0.1831≈0.18β^0=9.4867−0.1831×17.5≈6.2827≈6.28
因此回归方程为
y ^ = 6.28 + 0.18 x \hat{y}=6.28+0.18x y^=6.28+0.18x
题目已经给出显著性检验结果: F = 446 F=446 F=446,且
446 > 7.71 446>7.71 446>7.71
因此拒绝 H 0 H_0 H0,认为回归方程 显著。
这里补充说明一下:如果直接按题目给出的原始数据精确计算,得到的 F F F 值约为 4454.92 4454.92 4454.92,与截图中的 446 446 446 不一致。通常这类情况可理解为题面进行了近似简写或存在排版误差;填空时如果系统已经在题干中明确给出 F = 446 F=446 F=446,就按题面结论填写即可。
答案:
x ˉ = 17.5 \bar{x}=17.5 xˉ=17.5, y ˉ = 9.49 \bar{y}=9.49 yˉ=9.49, S x x = 437.5 S_{xx}=437.5 Sxx=437.5, S x y = 80.1 S_{xy}=80.1 Sxy=80.1, S y y = 14.68 S_{yy}=14.68 Syy=14.68
β ^ 0 = 6.34 \hat{\beta}_0=6.34 β^0=6.34, β ^ 1 = 0.18 \hat{\beta}_1=0.18 β^1=0.18
8️⃣ (7题续)当重量 x 0 = 16 x_0=16 x0=16 时,长度 y ^ 0 = ‾ \hat{y}_0=\underline{\qquad} y^0=;计算得 δ = 0.29 \delta=0.29 δ=0.29,则长度 y 0 y_0 y0 的双侧 95 % 95\% 95% 预测区间为 ‾ \underline{\qquad} 。
由上一题已经得到回归方程 y ^ = 6.28 + 0.18 x \hat{y}=6.28+0.18x y^=6.28+0.18x
当 x 0 = 16 x_0=16 x0=16 时, y ^ 0 = 6.28 + 0.18 × 16 = 9.16 \hat{y}_0=6.28+0.18\times 16=9.16 y^0=6.28+0.18×16=9.16
若按上一题更精确的回归系数计算,则 y ^ 0 ≈ 9.21 \hat{y}_0\approx 9.21 y^0≈9.21
题目又给出 δ = 0.29 \delta=0.29 δ=0.29,因此双侧 95 % 95\% 95% 预测区间为 ( y ^ 0 − δ , y ^ 0 + δ ) (\hat{y}_0-\delta,\ \hat{y}_0+\delta) (y^0−δ, y^0+δ)
代入更精确的预测值可得 ( 9.21 − 0.29 , 9.21 + 0.29 ) = ( 8.92 , 9.50 ) (9.21-0.29,\ 9.21+0.29)=(8.92,\ 9.50) (9.21−0.29, 9.21+0.29)=(8.92, 9.50)
所以本题填写为: y ^ 0 = 9.21 , 双侧 95 % 预测区间 = ( 8.92 , 9.50 ) \hat{y}_0=9.21,\qquad \text{双侧 }95\%\text{ 预测区间 }=(8.92,\ 9.50) y^0=9.21,双侧 95% 预测区间 =(8.92, 9.50)
答案:
y ^ 0 = 9.22 \hat{y}_0=9.22 y^0=9.22
双侧 95 % 95\% 95% 预测区间: ( 8.93 , 9.51 ) (8.93,\ 9.51) (8.93, 9.51)
题目9~11
9️⃣ 考察同一个班级的同学在参加了暑期数学培训班后,学习成绩是否有显著提高。数据如下表,假设学生成绩服从正态分布,显著性水平为 0.05 0.05 0.05,用成对数据检验,统计量的值为 ‾ \underline{\qquad} ,分位数的值为 ‾ \underline{\qquad} 。
培训前: 68 , 93 , 70 , 84 , 69 , 72 , 71 , 83 , 70 , 64 68,\ 93,\ 70,\ 84,\ 69,\ 72,\ 71,\ 83,\ 70,\ 64 68, 93, 70, 84, 69, 72, 71, 83, 70, 64
培训后: 88 , 93 , 69 , 73 , 90 , 84 , 83 , 84 , 60 , 86 88,\ 93,\ 69,\ 73,\ 90,\ 84,\ 83,\ 84,\ 60,\ 86 88, 93, 69, 73, 90, 84, 83, 84, 60, 86
因为是同一个班级培训前后的成绩比较,所以应采用 成对样本 t t t 检验。
设差值: d i = 培训后 − 培训前 d_i=\text{培训后}-\text{培训前} di=培训后−培训前
则各组差值为 20 , 0 , − 1 , − 11 , 21 , 12 , 12 , 1 , − 10 , 22 20,\ 0,\ -1,\ -11,\ 21,\ 12,\ 12,\ 1,\ -10,\ 22 20, 0, −1, −11, 21, 12, 12, 1, −10, 22
样本容量为 n = 10 n=10 n=10
差值样本均值为 d ˉ = 20 + 0 − 1 − 11 + 21 + 12 + 12 + 1 − 10 + 22 10 = 6.6 \bar{d}=\frac{20+0-1-11+21+12+12+1-10+22}{10}=6.6 dˉ=1020+0−1−11+21+12+12+1−10+22=6.6
差值样本标准差约为 s d ≈ 12.47 s_d\approx 12.47 sd≈12.47
因此检验统计量为 t = d ˉ s d / n = 6.6 12.47 / 10 ≈ 1.67 t=\frac{\bar{d}}{s_d/\sqrt{n}}=\frac{6.6}{12.47/\sqrt{10}}\approx 1.67 t=sd/n dˉ=12.47/10 6.6≈1.67
由于题目考查"是否有显著提高",所以备择假设应为 H 1 : μ d > 0 H_1:\mu_d>0 H1:μd>0
这是一个 右侧单边检验 ,自由度为 n − 1 = 9 n-1=9 n−1=9,在显著性水平 α = 0.05 \alpha=0.05 α=0.05 下,临界值为 t 0.95 ( 9 ) ≈ 1.83 t_{0.95}(9)\approx 1.83 t0.95(9)≈1.83
所以本题应填: 统计量 = 1.67 , 分位数 = 1.83 \text{统计量}=1.67,\qquad \text{分位数}=1.83 统计量=1.67,分位数=1.83
并且由于 1.67 < 1.83 1.67<1.83 1.67<1.83,故不能拒绝原假设,即没有充分证据认为培训后成绩有显著提高。
答案:
统计量 = 1.67 =1.67 =1.67
分位数 = 1.83 =1.83 =1.83
🔟 从 n = 20 n=20 n=20 的样本中得到有关回归分析结果:回归平方和为 60 60 60,残差平方和为 40 40 40。要检验 x x x 与 y y y 之间的线性关系是否显著,则检验统计量 F F F 的值为 ‾ \underline{\qquad} 。
在一元线性回归中,检验回归关系是否显著时,所用的统计量为
F = S S R / 1 S S E / ( n − 2 ) F=\frac{SSR/1}{SSE/(n-2)} F=SSE/(n−2)SSR/1
其中 S S R = 60 , S S E = 40 , n = 20 SSR=60,\qquad SSE=40,\qquad n=20 SSR=60,SSE=40,n=20
代入公式可得
F = 60 / 1 40 / ( 20 − 2 ) = 60 40 / 18 = 60 × 18 40 = 27 F=\frac{60/1}{40/(20-2)}=\frac{60}{40/18}=\frac{60\times 18}{40}=27 F=40/(20−2)60/1=40/1860=4060×18=27
所以检验统计量的值为 27。
答案:27
1️⃣1️⃣ 对于双正态总体 X ∼ N ( μ 1 , σ 1 2 ) X\sim N(\mu_1,\sigma_1^2) X∼N(μ1,σ12), Y ∼ N ( μ 2 , σ 2 2 ) Y\sim N(\mu_2,\sigma_2^2) Y∼N(μ2,σ22),在检验 H 0 : σ 1 2 = σ 2 2 , H 1 : σ 1 2 ≠ σ 2 2 H_0:\sigma_1^2=\sigma_2^2,\qquad H_1:\sigma_1^2\ne \sigma_2^2 H0:σ12=σ22,H1:σ12=σ22 时,使用的检验统计量为 F = S 1 2 S 2 2 F=\frac{S_1^2}{S_2^2} F=S22S12,其自由度为 ( n 1 − 1 , n 2 − 1 ) (n_1-1,n_2-1) (n1−1,n2−1),这里 S 1 2 , S 2 2 S_1^2,\ S_2^2 S12, S22 分别是两个样本的样本方差,求拒绝域。
这道题考查的是两个正态总体方差是否相等的 双侧 F F F 检验。
在原假设 H 0 : σ 1 2 = σ 2 2 H_0:\sigma_1^2=\sigma_2^2 H0:σ12=σ22成立时,有 F = S 1 2 S 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F=\frac{S_1^2}{S_2^2}\sim F(n_1-1,n_2-1) F=S22S12∼F(n1−1,n2−1)
由于备择假设为 H 1 : σ 1 2 ≠ σ 2 2 H_1:\sigma_1^2\ne \sigma_2^2 H1:σ12=σ22,这是一个双侧检验,因此当统计量 F F F 过大或过小时,都应拒绝原假设。
所以显著性水平为 α \alpha α 时,拒绝域应写为
W = { F < F α / 2 ( n 1 − 1 , n 2 − 1 ) } ∪ { F > F 1 − α / 2 ( n 1 − 1 , n 2 − 1 ) } W=\left\{F<F_{\alpha/2}(n_1-1,n_2-1)\right\}\cup\left\{F>F_{1-\alpha/2}(n_1-1,n_2-1)\right\} W={F<Fα/2(n1−1,n2−1)}∪{F>F1−α/2(n1−1,n2−1)}
若教材中统一用右侧分位点记号,也可等价写成
W = { F < F 1 − α / 2 ( n 1 − 1 , n 2 − 1 ) − 1 } ∪ { F > F α / 2 ( n 1 − 1 , n 2 − 1 ) } W=\left\{F<F_{1-\alpha/2}(n_1-1,n_2-1)^{-1}\right\}\cup\left\{F>F_{\alpha/2}(n_1-1,n_2-1)\right\} W={F<F1−α/2(n1−1,n2−1)−1}∪{F>Fα/2(n1−1,n2−1)}
核心意思就是:落在左尾或右尾都拒绝 H 0 H_0 H0。
答案:
W = { F < F α / 2 ( n 1 − 1 , n 2 − 1 ) } ∪ { F > F 1 − α / 2 ( n 1 − 1 , n 2 − 1 ) } W=\left\{F<F_{\alpha/2}(n_1-1,n_2-1)\right\}\cup\left\{F>F_{1-\alpha/2}(n_1-1,n_2-1)\right\} W={F<Fα/2(n1−1,n2−1)}∪{F>F1−α/2(n1−1,n2−1)}
三、判断题
题目12~14
1️⃣2️⃣ 某比萨饼店经理为了说明他们在送货业务上的快递高效,从以往的记录中随机选取了 12 12 12 份订单,送货距离分别为 2 k m , 5 k m , 8 k m , 15 k m 2km,5km,8km,15km 2km,5km,8km,15km,每个距离有三份订单;记录从商店送到顾客处所需时间。题目给出:
x ˉ = 7.5 , y ˉ = 36.125 , S x x = 279 , S x y = 1143.65 , S y y = 5081.52 β ^ 0 = 5.38 , β ^ 1 = 4.10 , y ^ = 5.38 + 4.10 x \bar{x}=7.5,\ \bar{y}=36.125,\ S_{xx}=279,\ S_{xy}=1143.65,\ S_{yy}=5081.52 \\ \hat{\beta}_0=5.38,\ \hat{\beta}_1=4.10,\ \hat{y}=5.38+4.10x xˉ=7.5, yˉ=36.125, Sxx=279, Sxy=1143.65, Syy=5081.52β^0=5.38, β^1=4.10, y^=5.38+4.10x
并称回归显著性检验中 F = 119.47 F=119.47 F=119.47,查表得分位数为 4.96 4.96 4.96,故回归方程显著。判断对错。
- A. 对 ✅
- B. 错
按原始数据计算: x ˉ = 7.5 , y ˉ = 36.125 , S x x = 279 , S x y = 1143.65 , S y y = 5081.52 \bar{x}=7.5,\qquad \bar{y}=36.125,\qquad S_{xx}=279,\qquad S_{xy}=1143.65,\qquad S_{yy}=5081.52 xˉ=7.5,yˉ=36.125,Sxx=279,Sxy=1143.65,Syy=5081.52
因此
β ^ 1 = S x y S x x = 1143.65 279 ≈ 4.10 , β ^ 0 = y ˉ − β ^ 1 x ˉ ≈ 5.38 \hat{\beta}1=\frac{S{xy}}{S_{xx}}=\frac{1143.65}{279}\approx 4.10, \qquad \hat{\beta}_0=\bar{y}-\hat{\beta}_1\bar{x}\approx 5.38 β^1=SxxSxy=2791143.65≈4.10,β^0=yˉ−β^1xˉ≈5.38
所以回归方程 y ^ = 5.38 + 4.10 x \hat{y}=5.38+4.10x y^=5.38+4.10x 也是正确的。
若用精确数据计算, F F F 值约为 F ≈ 119.11 F\approx 119.11 F≈119.11,与题面写的 119.47 119.47 119.47 只有近似误差,不影响结论。
因为 119.11 > 4.96 119.11>4.96 119.11>4.96,所以回归方程显著这一判断是正确的。
答案:A. 对
1️⃣3️⃣ 样本均值点 ( x ˉ , y ˉ ) (\bar{x},\bar{y}) (xˉ,yˉ) 落在回归直线上。
- A. 对 ✅
- B. 错
在线性回归中,最小二乘回归直线一定经过样本中心点 ( x ˉ , y ˉ ) (\bar{x},\bar{y}) (xˉ,yˉ)
因为回归方程 y ^ = β ^ 0 + β ^ 1 x \hat{y}=\hat{\beta}_0+\hat{\beta}_1x y^=β^0+β^1x 中有
β ^ 0 = y ˉ − β ^ 1 x ˉ \hat{\beta}_0=\bar{y}-\hat{\beta}_1\bar{x} β^0=yˉ−β^1xˉ
所以当 x = x ˉ x=\bar{x} x=xˉ 时,
y ^ = β ^ 0 + β ^ 1 x ˉ = y ˉ \hat{y}=\hat{\beta}_0+\hat{\beta}_1\bar{x}=\bar{y} y^=β^0+β^1xˉ=yˉ
因此样本均值点一定在回归直线上。
答案:A. 对
1️⃣4️⃣ 残差平方和是 σ 2 \sigma^2 σ2 的无偏估计。
- A. 对
- B. 错 ✅
残差平方和记为
S S E = ∑ ( y i − y ^ i ) 2 SSE=\sum (y_i-\hat{y}_i)^2 SSE=∑(yi−y^i)2
它本身不是 σ 2 \sigma^2 σ2 的无偏估计。
真正对 σ 2 \sigma^2 σ2 的无偏估计是均方误差
M S E = S S E n − 2 MSE=\frac{SSE}{n-2} MSE=n−2SSE
在一元线性回归中,自由度要扣掉两个参数 β 0 , β 1 \beta_0,\beta_1 β0,β1,所以应除以 n − 2 n-2 n−2。
因此原命题错误。
答案:B. 错
题目15~17
1️⃣5️⃣ 回归显著性检验中,接受原假设,则是认为变量 y y y 与 x x x 之间确实存在线性关系。
- A. 对
- B. 错 ✅
回归显著性检验通常检验
H 0 : β 1 = 0 , H 1 : β 1 ≠ 0 H_0:\beta_1=0,\qquad H_1:\beta_1\ne 0 H0:β1=0,H1:β1=0
如果"接受原假设"或更准确地说"不能拒绝原假设",只能说明 没有充分证据表明线性关系显著。
这并不等于说变量之间"确实存在线性关系",恰恰相反,它表示样本信息不足以支持显著线性关系成立。
因此原命题错误。
答案:B. 错
1️⃣6️⃣ 回归平方和反应了由于 X X X 和 Y Y Y 的线性关系所引起的波动。
- A. 对 ✅
- B. 错
在方差分析分解中,
S y y = S S R + S S E S_{yy}=SSR+SSE Syy=SSR+SSE
其中回归平方和 S S R SSR SSR 表示由回归模型所解释的那部分波动,也就是由 X X X 与 Y Y Y 的线性关系所引起的变异。
而残差平方和 S S E SSE SSE 表示未被线性关系解释的随机误差部分。
因此该说法正确。
答案:A. 对
1️⃣7️⃣ 一药厂生产一种新的止痛片,厂方希望验证服用新药片后至开始起作用的时间间隔较原有止痛片至少缩短一半,因此提出假设 H 0 : μ 1 ≤ 2 μ 2 , H 1 : μ 1 > 2 μ 2 H_0:\mu_1\le 2\mu_2,\qquad H_1:\mu_1>2\mu_2 H0:μ1≤2μ2,H1:μ1>2μ2,其中 μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2 分别是服用原有止痛片和新止痛片后至起作用时间间隔总体均值。设两总体均为正态且方差分别为已知值 σ 1 2 , σ 2 2 \sigma_1^2,\sigma_2^2 σ12,σ22,分别抽取独立样本 X 1 , ⋯ , X n X_1,\cdots,X_n X1,⋯,Xn 和 Y 1 , ⋯ , Y m Y_1,\cdots,Y_m Y1,⋯,Ym。题目给出的检验统计量为
U = X ‾ − 2 Y ‾ σ 1 2 n + 4 σ 2 2 m U=\frac{\overline{X}-2\overline{Y}}{\sqrt{\dfrac{\sigma_1^2}{n}+\dfrac{4\sigma_2^2}{m}}} U=nσ12+m4σ22 X−2Y
判断对错。
- A. 对 ✅
- B. 错
这道题本质上是对线性组合 μ 1 − 2 μ 2 \mu_1-2\mu_2 μ1−2μ2进行检验。
在原假设边界 μ 1 − 2 μ 2 = 0 \mu_1-2\mu_2=0 μ1−2μ2=0 下,由于两个样本独立,且总体方差已知,所以有
X ‾ − 2 Y ‾ ∼ N ( μ 1 − 2 μ 2 , σ 1 2 n + 4 σ 2 2 m ) \overline{X}-2\overline{Y}\sim N\left(\mu_1-2\mu_2,\ \frac{\sigma_1^2}{n}+\frac{4\sigma_2^2}{m}\right) X−2Y∼N(μ1−2μ2, nσ12+m4σ22)
标准化后得到检验统计量
U = ( X ‾ − 2 Y ‾ ) − 0 σ 1 2 n + 4 σ 2 2 m U=\frac{(\overline{X}-2\overline{Y})-0}{\sqrt{\dfrac{\sigma_1^2}{n}+\dfrac{4\sigma_2^2}{m}}} U=nσ12+m4σ22 (X−2Y)−0
这与题目给出的统计量完全一致,所以题目说法正确。
若进一步写拒绝域,则因为备择假设是 H 1 : μ 1 > 2 μ 2 H_1:\mu_1>2\mu_2 H1:μ1>2μ2,所以是 右侧检验 ,拒绝域可写为 W = { U > u α } W=\{U>u_\alpha\} W={U>uα}
答案:A. 对
四、多选题
题目18
1️⃣8️⃣ 某厂产品的不合格率通常为 5 % 5\% 5%,厂方希望知道更换原料产地后是否对产品质量产生显著影响。今随机从一批产品中抽取 100 100 100 个,发现 7 7 7 个不合格,试问厂方可以得出什么结论?
- A. 此问题属于非正态大样本假设检验问题 ✅
- B. 样本容量成分大,可以采用 U U U 检验 ✅
- C. 不合格率没有显著变化,原料产地对产品质量没有显著影响。 ✅
- D. 不合格率超过 5 % 5\% 5%,原料产地对产品质量有显著影响。
设总体不合格率为 p p p,则题目要检验的是更换原料产地后,不合格率是否发生显著变化,因此可设 H 0 : p = 0.05 , H 1 : p ≠ 0.05 H_0:p=0.05,\qquad H_1:p\ne 0.05 H0:p=0.05,H1:p=0.05
样本容量为 n = 100 n=100 n=100,样本不合格率为 p ^ = 7 100 = 0.07 \hat{p}=\frac{7}{100}=0.07 p^=1007=0.07
这是单总体成数的大样本检验问题,可采用正态近似的 U U U 检验统计量:
U = p ^ − p 0 p 0 ( 1 − p 0 ) n U=\frac{\hat{p}-p_0}{\sqrt{\dfrac{p_0(1-p_0)}{n}}} U=np0(1−p0) p^−p0
代入 p 0 = 0.05 p_0=0.05 p0=0.05,得
U = 0.07 − 0.05 0.05 × 0.95 100 ≈ 0.92 U=\frac{0.07-0.05}{\sqrt{\dfrac{0.05\times 0.95}{100}}}\approx 0.92 U=1000.05×0.95 0.07−0.05≈0.92
在显著性水平 0.05 0.05 0.05 下,双侧检验的临界值约为 1.96 1.96 1.96
因为 ∣ 0.92 ∣ < 1.96 |0.92|<1.96 ∣0.92∣<1.96,所以不能拒绝原假设,说明不合格率没有显著变化,不能认为更换原料产地对产品质量产生了显著影响。
因此:
- A 正确,这是非正态总体条件下的大样本成数检验问题。
- B 正确,可以用 U U U 检验。
- C 正确,不合格率没有显著变化。
- D 错误,虽然样本不合格率是 7 % 7\% 7%,但并未达到"显著变化"的程度。
答案:A、B、C