【TJU】应用统计学------第一周作业(1.1 数理统计的基本内容、1.2 数理统计的基本概念)
一、单选题
题目1~3
1️⃣ 如果样本观测值是 ( 2 , 3 , 4 , 1 , 3 , 2 , 3 , 2 ) (2, 3, 4, 1, 3, 2, 3, 2) (2,3,4,1,3,2,3,2),则样本容量、样本均值和样本方差分别为( )
- A. 9; 1.5; 0.34
- B. 8; 2.5; 0.86 ✅
- C. 5; 1.5; 0.47
- D. 10; 3.5; 0.84
根据题目给出的观测值序列 ( 2 , 3 , 4 , 1 , 3 , 2 , 3 , 2 ) (2, 3, 4, 1, 3, 2, 3, 2) (2,3,4,1,3,2,3,2),可以按以下步骤进行统计计算:
1. 样本容量 ( n n n): 样本容量是指观测值的个数。该序列中共有 8 个数字,因此 n = 8 n = 8 n=8。
2. 样本均值 ( x ˉ \bar{x} xˉ): 样本均值是所有观测值的总和除以样本容量:
x ˉ = ∑ i = 1 n x i n = 2 + 3 + 4 + 1 + 3 + 2 + 3 + 2 8 = 20 8 = 2.5 \bar{x} = \frac{\sum_{i=1}^{n} x_i}{n} = \frac{2+3+4+1+3+2+3+2}{8} = \frac{20}{8} = 2.5 xˉ=n∑i=1nxi=82+3+4+1+3+2+3+2=820=2.5
3. 样本方差 ( s 2 s^2 s2): 在统计学中,样本方差通常采用无偏估计公式(分母为 n − 1 n-1 n−1): s 2 = ∑ ( x i − x ˉ ) 2 n − 1 s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1} s2=n−1∑(xi−xˉ)2
先计算离差平方和: ∑ ( x i − 2.5 ) 2 = 0.25 + 0.25 + 2.25 + 2.25 + 0.25 + 0.25 + 0.25 + 0.25 = 6.0 \sum (x_i - 2.5)^2 = 0.25 + 0.25 + 2.25 + 2.25 + 0.25 + 0.25 + 0.25 + 0.25 = 6.0 ∑(xi−2.5)2=0.25+0.25+2.25+2.25+0.25+0.25+0.25+0.25=6.0
代入公式: s 2 = 6.0 8 − 1 = 6 7 ≈ 0.86 s^2 = \frac{6.0}{8 - 1} = \frac{6}{7} \approx 0.86 s2=8−16.0=76≈0.86
综上所述,计算结果分别为 8、2.5 和 0.86,与选项 B 相符。
答案:B. 8; 2.5; 0.86
2️⃣ 从一堆苹果中随机挑选出 10 个,重量如下(单位: g g g): 106 , 107 , 97 , 84 , 89 , 102 , 102 , 89 , 86 , 89 106, 107, 97, 84, 89, 102, 102, 89, 86, 89 106,107,97,84,89,102,102,89,86,89。则苹果质量的众数、中位数、平均数、极差分别为( )
- A. 89 ; 93 ; 95.1 ; 23 89; 93; 95.1; 23 89;93;95.1;23 ✅
- B. 102 ; 89 ; 94 ; 21 102; 89; 94; 21 102;89;94;21
- C. 89 ; 89 ; 89 ; 23 89; 89; 89; 23 89;89;89;23
- D. 102 ; 89 ; 92 ; 32 102; 89; 92; 32 102;89;92;32
首先,将这 10 个数据按从小到大的顺序排列: 84 , 86 , 89 , 89 , 89 , 97 , 102 , 102 , 106 , 107 84, 86, 89, 89, 89, 97, 102, 102, 106, 107 84,86,89,89,89,97,102,102,106,107
1. 众数(Mode): 众数是一组数据中出现次数最多的数值。数据中 89 89 89 出现了 3 次,次数最多,因此 众数为 89 89 89。
2. 中位数(Median): 中位数是将数据排序后处于中间位置的数。由于样本容量 n = 10 n=10 n=10 为偶数,中位数取中间两个数(第 5 个和第 6 个)的平均值: 中位数 = 89 + 97 2 = 93 \text{中位数} = \frac{89 + 97}{2} = 93 中位数=289+97=93
3. 平均数(Mean): 平均数是所有观测值的总和除以观测次数: x ˉ = 106 + 107 + 97 + 84 + 89 + 102 + 102 + 89 + 86 + 89 10 = 951 10 = 95.1 \bar{x} = \frac{106+107+97+84+89+102+102+89+86+89}{10} = \frac{951}{10} = 95.1 xˉ=10106+107+97+84+89+102+102+89+86+89=10951=95.1
4. 极差(Range): 极差是数据中的最大值与最小值之差: = 107 − 84 = 23 = 107 - 84 = 23 =107−84=23
综合以上计算结果,对应选项 A。
答案:A. 89 ; 93 ; 95.1 ; 23 89; 93; 95.1; 23 89;93;95.1;23
3️⃣ 设 ( X 1 , X 2 , ... , X n ) (X_1, X_2, \dots, X_n) (X1,X2,...,Xn) 为来自泊松分布总体 P ( λ ) P(\lambda) P(λ) 的样本, X ˉ \bar{X} Xˉ 和 S 2 S^2 S2 分别表示样本均值和样本方差,记统计量 T = X ˉ + S 2 T = \bar{X} + S^2 T=Xˉ+S2,则 E ( T ) = E(T) = E(T)=( )
- A. λ ( 1 + λ ) \lambda(1 + \lambda) λ(1+λ)
- B. 2 λ 2\lambda 2λ ✅
- C. λ 2 \lambda^2 λ2
- D. 0
要计算统计量 T T T 的期望 E ( T ) E(T) E(T),需要利用泊松分布的性质以及样本统计量的基本性质:
1. 总体分布的性质: 对于泊松分布 X ∼ P ( λ ) X \sim P(\lambda) X∼P(λ),其数学期望和方差相等,均等于参数 λ \lambda λ。即:
E ( X ) = λ , V a r ( X ) = λ E(X) = \lambda, \quad Var(X) = \lambda E(X)=λ,Var(X)=λ
2. 样本均值 X ˉ \bar{X} Xˉ 的期望: 样本均值是总体期望 E ( X ) E(X) E(X) 的无偏估计量,因此:
E ( X ˉ ) = E ( X ) = λ E(\bar{X}) = E(X) = \lambda E(Xˉ)=E(X)=λ
3. 样本方差 S 2 S^2 S2 的期望: 样本方差(修正样本方差)是总体方差 V a r ( X ) Var(X) Var(X) 的无偏估计量,因此:
E ( S 2 ) = V a r ( X ) = λ E(S^2) = Var(X) = \lambda E(S2)=Var(X)=λ
4. 计算 E ( T ) E(T) E(T): 根据期望的线性性质:
E ( T ) = E ( X ˉ + S 2 ) = E ( X ˉ ) + E ( S 2 ) E ( T ) = λ + λ = 2 λ E(T) = E(\bar{X} + S^2) = E(\bar{X}) + E(S^2) \\ E(T) = \lambda + \lambda = 2\lambda E(T)=E(Xˉ+S2)=E(Xˉ)+E(S2)E(T)=λ+λ=2λ
故统计量 T T T 的数学期望为 2 λ 2\lambda 2λ。
答案:B. 2 λ 2\lambda 2λ
题目4~5
4️⃣ 设 ( X 1 , X 2 , ... , X n ) (X_1, X_2, \dots, X_n) (X1,X2,...,Xn) 为取自二项分布总体 b ( n , p ) b(n, p) b(n,p) 的样本, X ˉ \bar{X} Xˉ 和 S 2 S^2 S2 分别表示样本均值和样本方差。记 T = X ˉ − S 2 T = \bar{X} - S^2 T=Xˉ−S2,则 E ( T ) = E(T) = E(T)=( )
- A. n p np np
- B. n p ( 1 − p ) np(1 - p) np(1−p)
- C. n p 2 np^2 np2 ✅
- D. p ( 1 − p ) p(1 - p) p(1−p)
要计算统计量 T T T 的数学期望 E ( T ) E(T) E(T),需要结合二项分布的性质和样本统计量的基本性质:
1. 总体分布性质: 已知总体服从二项分布 X ∼ B ( n , p ) X \sim B(n, p) X∼B(n,p),根据二项分布的公式,其总体的数学期望和方差分别为:
E ( X ) = n p , V a r ( X ) = n p ( 1 − p ) E(X) = np, \quad Var(X) = np(1 - p) E(X)=np,Var(X)=np(1−p)
2. 样本统计量的期望: 在抽样理论中,样本均值 X ˉ \bar{X} Xˉ 是总体期望 E ( X ) E(X) E(X) 的无偏估计,样本方差 S 2 S^2 S2(修正样本方差)是总体方差 V a r ( X ) Var(X) Var(X) 的无偏估计。因此:
E ( X ˉ ) = E ( X ) = n p E ( S 2 ) = V a r ( X ) = n p ( 1 − p ) E(\bar{X}) = E(X) = np \\ E(S^2) = Var(X) = np(1 - p) E(Xˉ)=E(X)=npE(S2)=Var(X)=np(1−p)
3. 计算 E ( T ) E(T) E(T): 利用期望的线性性质,可以得到: E ( T ) = E ( X ˉ − S 2 ) = E ( X ˉ ) − E ( S 2 ) E(T) = E(\bar{X} - S^2) = E(\bar{X}) - E(S^2) E(T)=E(Xˉ−S2)=E(Xˉ)−E(S2)
代入上述结果:
E ( T ) = n p − [ n p ( 1 − p ) ] = n p − ( n p − n p 2 ) = n p 2 E(T) = np - [np(1 - p)] = np - (np - np^2) = np^2 E(T)=np−[np(1−p)]=np−(np−np2)=np2
因此,统计量 T T T 的数学期望为 n p 2 np^2 np2。
答案:C. n p 2 np^2 np2
5️⃣ 一个大小为 n n n 的样本的样本方差是 n n n 项平方和除以( )
- A. n n n
- B. n − 1 n-1 n−1 ✅
在统计学中,样本方差(Sample Variance)是用来衡量样本数据离散程度的一个重要指标。
其计算公式通常为: s 2 = ∑ i = 1 n ( x i − x ˉ ) 2 n − 1 s^2 = \frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1} s2=n−1∑i=1n(xi−xˉ)2
其中,分母采用 n − 1 n-1 n−1 而非 n n n 的主要原因是为了实现无偏估计。
由于在计算方差时,使用的是样本均值 x ˉ \bar{x} xˉ 而非总体的真实均值 μ \mu μ,这会导致计算出的偏差平方和偏小。为了修正这一偏差,统计学上引入了"贝塞尔修正"(Bessel's Correction),将分母由 n n n 改为 n − 1 n-1 n−1(即样本的自由度),从而使得样本方差的期望值等于总体的方差。
答案:B. n − 1 n-1 n−1
二、多选题
题目6~7
6️⃣ 设 ( x 1 , x 2 , ... , x n ) (x_1, x_2, \dots, x_n) (x1,x2,...,xn) 及 ( y 1 , y 2 , ... , y n ) (y_1, y_2, \dots, y_n) (y1,y2,...,yn) 为两组样本观测值,有 y i = x i − a b y_i = \frac{x_i - a}{b} yi=bxi−a ( b ≠ 0 b \neq 0 b=0, a a a 为常数),则样本均值 y ˉ \bar{y} yˉ 和 x ˉ \bar{x} xˉ,及样本方差 S y 2 S_y^2 Sy2 和 S x 2 S_x^2 Sx2 之间的关系为( )
- A. S y 2 = S x 2 b 2 S_y^2 = \frac{S_x^2}{b^2} Sy2=b2Sx2 ✅
- B. y ˉ = x ˉ \bar{y} = \bar{x} yˉ=xˉ
- C. y ˉ = x ˉ − a b \bar{y} = \frac{\bar{x} - a}{b} yˉ=bxˉ−a ✅
- D. S y 2 = S x 2 b S_y^2 = \frac{S_x^2}{b} Sy2=bSx2
本题考查的是样本均值和样本方差在线性变换下的性质。已知 y i = 1 b x i − a b y_i = \frac{1}{b}x_i - \frac{a}{b} yi=b1xi−ba,可以根据统计量的性质进行推导:
1. 样本均值的关系: 样本均值具有线性性质。对于 y i = x i − a b y_i = \frac{x_i - a}{b} yi=bxi−a,其均值满足:
y ˉ = 1 n ∑ i = 1 n x i − a b = 1 b ( 1 n ∑ i = 1 n x i − 1 n ⋅ n a ) = x ˉ − a b \bar{y} = \frac{1}{n} \sum_{i=1}^{n} \frac{x_i - a}{b} = \frac{1}{b} \left( \frac{1}{n} \sum_{i=1}^{n} x_i - \frac{1}{n} \cdot na \right) = \frac{\bar{x} - a}{b} yˉ=n1i=1∑nbxi−a=b1(n1i=1∑nxi−n1⋅na)=bxˉ−a
因此,选项 C 正确。
2. 样本方差的关系: 样本方差衡量的是数据的波动幅度。常数的加减(平移)不改变方差,而倍数缩放会使方差变为原倍数的平方。根据方差公式 S 2 = 1 n − 1 ∑ ( x i − x ˉ ) 2 S^2 = \frac{1}{n-1} \sum (x_i - \bar{x})^2 S2=n−11∑(xi−xˉ)2:
y i − y ˉ = x i − a b − x ˉ − a b = x i − x ˉ b y_i - \bar{y} = \frac{x_i - a}{b} - \frac{\bar{x} - a}{b} = \frac{x_i - \bar{x}}{b} yi−yˉ=bxi−a−bxˉ−a=bxi−xˉ
将其代入 S y 2 S_y^2 Sy2 的公式中:
S y 2 = 1 n − 1 ∑ ( y i − y ˉ ) 2 = 1 n − 1 ∑ ( x i − x ˉ b ) 2 = 1 b 2 ⋅ 1 n − 1 ∑ ( x i − x ˉ ) 2 = S x 2 b 2 S_y^2 = \frac{1}{n-1} \sum (y_i - \bar{y})^2 = \frac{1}{n-1} \sum \left( \frac{x_i - \bar{x}}{b} \right)^2 = \frac{1}{b^2} \cdot \frac{1}{n-1} \sum (x_i - \bar{x})^2 = \frac{S_x^2}{b^2} Sy2=n−11∑(yi−yˉ)2=n−11∑(bxi−xˉ)2=b21⋅n−11∑(xi−xˉ)2=b2Sx2
因此,选项 A 正确。
答案:A. S y 2 = S x 2 b 2 S_y^2 = \frac{S_x^2}{b^2} Sy2=b2Sx2、C. y ˉ = x ˉ − a b \bar{y} = \frac{\bar{x} - a}{b} yˉ=bxˉ−a
7️⃣ 设总体服从参数为 p p p 的两点分布,即 X ∼ b ( 1 , p ) X \sim b(1, p) X∼b(1,p),其中 0 < p < 1 0 < p < 1 0<p<1 是未知参数, ( X 1 , X 2 , ... , X 5 ) (X_1, X_2, \dots, X_5) (X1,X2,...,X5) 是从中抽取的一个样本,则下列哪些函数是统计量( )
- A. T 1 = 1 2 ( X 1 + X 2 ) T_1 = \frac{1}{2}(X_1 + X_2) T1=21(X1+X2) ✅
- B. T 2 = X 1 − E ( X 2 ) T_2 = X_1 - E(X_2) T2=X1−E(X2)
- C. T 3 = X 1 − p T_3 = X_1 - p T3=X1−p
- D. T 4 = max 1 ≤ i ≤ 5 X i T_4 = \max_{1 \le i \le 5} X_i T4=max1≤i≤5Xi ✅
- E. T 5 = X ( 1 ) T_5 = X_{(1)} T5=X(1) ✅
- F. T 6 = ∑ i = 1 5 ( X i − E ( X i ) ) 2 T_6 = \sum_{i=1}^{5} (X_i - E(X_i))^2 T6=∑i=15(Xi−E(Xi))2
要判断一个函数是否为统计量 ,关键在于理解统计量的定义:统计量是样本的函数,且其表达式中不包含任何未知参数。
本题中,总体服从两点分布 b ( 1 , p ) b(1, p) b(1,p),其中 p p p 是未知参数 。同时对于该分布,其数学期望 E ( X ) = p E(X) = p E(X)=p。
逐一分析各项函数:
1. T 1 = 1 2 ( X 1 + X 2 ) T_1 = \frac{1}{2}(X_1 + X_2) T1=21(X1+X2) :仅由样本观测值组成,不含未知参数 p p p,是统计量。
2. T 2 = X 1 − E ( X 2 ) T_2 = X_1 - E(X_2) T2=X1−E(X2) :由于 E ( X 2 ) = p E(X_2) = p E(X2)=p,实质上 T 2 = X 1 − p T_2 = X_1 - p T2=X1−p,包含了未知参数 p p p,不是统计量。
3. T 3 = X 1 − p T_3 = X_1 - p T3=X1−p :直接包含了未知参数 p p p,不是统计量。
4. T 4 = max 1 ≤ i ≤ 5 X i T_4 = \max_{1 \le i \le 5} X_i T4=max1≤i≤5Xi :极值统计量,仅取决于样本观测值的大小,不含 p p p,是统计量。
5. T 5 = X ( 1 ) T_5 = X_{(1)} T5=X(1) :顺序统计量(最小值),仅取决于样本观测值,不含 p p p,是统计量。
6. T 6 = ∑ i = 1 5 ( X i − E ( X i ) ) 2 T_6 = \sum_{i=1}^{5} (X_i - E(X_i))^2 T6=∑i=15(Xi−E(Xi))2 :由于 E ( X i ) = p E(X_i) = p E(Xi)=p,该式等同于 ∑ ( X i − p ) 2 \sum (X_i - p)^2 ∑(Xi−p)2,包含了未知参数 p p p,不是统计量。
综上所述, T 1 , T 4 , T 5 T_1, T_4, T_5 T1,T4,T5 符合统计量的定义。
答案:ADE
三、填空题
题目8
8️⃣ 设总体 X X X 的概率密度为 f ( x ) = 1 2 e − ∣ x ∣ , − ∞ < x < + ∞ f(x) = \frac{1}{2} e^{-|x|}, -\infty < x < +\infty f(x)=21e−∣x∣,−∞<x<+∞。 ( X 1 , X 2 , ... , X n ) (X_1, X_2, \dots, X_n) (X1,X2,...,Xn) 为总体 X X X 的简单随机样本,其样本方差为 S 2 S^2 S2,则 E ( S 2 ) = E(S^2) = E(S2)= ____
要计算样本方差 S 2 S^2 S2 的期望值,需要利用统计学中关于无偏估计的基本性质以及该特定概率分布的性质:
**1. 样本方差的期望性质:**对于来自任何总体的简单随机样本,其样本方差(修正样本方差) S 2 S^2 S2 始终是总体方差 σ 2 \sigma^2 σ2 的无偏估计量。即:
E ( S 2 ) = V a r ( X ) = σ 2 E(S^2) = Var(X) = \sigma^2 E(S2)=Var(X)=σ2
2. 计算总体的方差 V a r ( X ) Var(X) Var(X): 给定的概率密度函数 f ( x ) = 1 2 e − ∣ x ∣ f(x) = \frac{1}{2} e^{-|x|} f(x)=21e−∣x∣ 是参数为 μ = 0 , b = 1 \mu=0, b=1 μ=0,b=1 的拉普拉斯分布 (Laplace Distribution)。
由于概率密度函数关于 x = 0 x=0 x=0 对称,因此其数学期望为: E ( X ) = 0 E(X) = 0 E(X)=0
根据方差的定义 V a r ( X ) = E ( X 2 ) − [ E ( X ) ] 2 Var(X) = E(X^2) - [E(X)]^2 Var(X)=E(X2)−[E(X)]2,只需计算 E ( X 2 ) E(X^2) E(X2):
E ( X 2 ) = ∫ − ∞ + ∞ x 2 ⋅ 1 2 e − ∣ x ∣ d x E(X^2) = \int_{-\infty}^{+\infty} x^2 \cdot \frac{1}{2} e^{-|x|} dx E(X2)=∫−∞+∞x2⋅21e−∣x∣dx
利用函数的偶倍性,简化为:
E ( X 2 ) = 2 ∫ 0 + ∞ x 2 ⋅ 1 2 e − x d x = ∫ 0 + ∞ x 2 e − x d x E(X^2) = 2 \int_{0}^{+\infty} x^2 \cdot \frac{1}{2} e^{-x} dx = \int_{0}^{+\infty} x^2 e^{-x} dx E(X2)=2∫0+∞x2⋅21e−xdx=∫0+∞x2e−xdx
利用分部积分法或伽马函数公式 ∫ 0 ∞ x n e − x d x = n ! \int_{0}^{\infty} x^n e^{-x} dx = n! ∫0∞xne−xdx=n! 可得:
E ( X 2 ) = 2 ! = 2 E(X^2) = 2! = 2 E(X2)=2!=2
3. 得出结论:
因为 V a r ( X ) = 2 − 0 2 = 2 Var(X) = 2 - 0^2 = 2 Var(X)=2−02=2,所以 E ( S 2 ) = 2 E(S^2) = 2 E(S2)=2。
答案:2
四、判断题
题目9~10
9️⃣ 研究灯泡的使用寿命时,总体是所有的灯泡,个体是一个灯泡。( )
- A. 对
- B. 错 ✅
在统计学中,总体 是指研究对象的全体观测值的集合,而个体是总体中的每一个观测值。
当研究"灯泡的使用寿命"时,核心关注点是"寿命"这一数量指标。因此,总体应该是"所有灯泡的使用寿命的集合",个体则是"每一个灯泡的使用寿命"。
题目中直接将物理意义上的"灯泡"定义为总体和个体是不准确的,应当明确其对应的数量特征。
答案:B. 错
🔟 最大次序统计量与最小次序统计量独立。( )
- A. 对
- B. 错 ✅
次序统计量是将样本观测值由小到大排列后得到的,通常记为 X ( 1 ) ≤ X ( 2 ) ≤ ⋯ ≤ X ( n ) X_{(1)} \le X_{(2)} \le \dots \le X_{(n)} X(1)≤X(2)≤⋯≤X(n)。
对于来自同一总体的样本,其各个次序统计量之间通常是不独立 的。这是因为它们之间存在严格的大小排序关系:最小次序统计量 X ( 1 ) X_{(1)} X(1) 的取值会直接限制最大次序统计量 X ( n ) X_{(n)} X(n) 的取值范围(即 X ( n ) ≥ X ( 1 ) X_{(n)} \ge X_{(1)} X(n)≥X(1))。
由于两者之间存在这种必然的数值约束和关联,因此它们并不满足相互独立的条件。
答案:B. 错