【TJU】研究生应用统计学课程笔记(3)------第一章 数理统计的基本知识
- [1.4 正态总体的样本均值和样本方差的分布](#1.4 正态总体的样本均值和样本方差的分布)
-
-
- [1️⃣ 单一正态总体的样本均值和样本方差的分布](#1️⃣ 单一正态总体的样本均值和样本方差的分布)
- [2️⃣ 不同正态总体的样本均值和样本方差的分布](#2️⃣ 不同正态总体的样本均值和样本方差的分布)
-
- [1.5 充分统计量和完备统计量](#1.5 充分统计量和完备统计量)
-
- [1.5.1 充分统计量](#1.5.1 充分统计量)
-
- [1️⃣ 充分统计量的定义](#1️⃣ 充分统计量的定义)
- [2️⃣ 因子分解定理](#2️⃣ 因子分解定理)
- [3️⃣ 联合充分统计量定义](#3️⃣ 联合充分统计量定义)
- [1.5.2 完备统计量](#1.5.2 完备统计量)
-
- [1️⃣ 分布族的完备性](#1️⃣ 分布族的完备性)
- [2️⃣ 完备统计量](#2️⃣ 完备统计量)
- [3️⃣ 充分完备统计量](#3️⃣ 充分完备统计量)
1.4 正态总体的样本均值和样本方差的分布
1️⃣ 单一正态总体的样本均值和样本方差的分布
设 ( X 1 , ... , X n ) (X_1, \dots, X_n) (X1,...,Xn) 是取自正态总体 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2) 的一个样本, X ˉ = 1 n ∑ i = 1 n X i \bar{X} = \frac{1}{n} \sum_{i=1}^n X_i Xˉ=n1∑i=1nXi, S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 S^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2 S2=n−11∑i=1n(Xi−Xˉ)2 分别为样本均值和样本方差,则:
1、 X ˉ ∼ N ( μ , σ 2 n ) \bar{X} \sim N(\mu, \frac{\sigma^2}{n}) Xˉ∼N(μ,nσ2)
理由: ∵ E X ˉ = μ ; D X ˉ = σ 2 n \because E\bar{X} = \mu; \ D\bar{X} = \frac{\sigma^2}{n} ∵EXˉ=μ; DXˉ=nσ2
2、 ∑ i = 1 n ( X i − μ ) 2 σ 2 ∼ χ 2 ( n ) \frac{\sum_{i=1}^n (X_i - \mu)^2}{\sigma^2} \sim \chi^2(n) σ2∑i=1n(Xi−μ)2∼χ2(n)
理由: ∵ X i − μ σ ∼ N ( 0 , 1 ) \because \frac{X_i - \mu}{\sigma} \sim N(0,1) ∵σXi−μ∼N(0,1)(标准正态分布的平方和服从卡方分布)
3、 ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) σ2(n−1)S2∼χ2(n−1)
注: ( n − 1 ) S 2 σ 2 = ∑ i = 1 n ( X i − X ˉ ) 2 σ 2 \frac{(n-1)S^2}{\sigma^2} = \frac{\sum_{i=1}^n (X_i - \bar{X})^2}{\sigma^2} σ2(n−1)S2=σ2∑i=1n(Xi−Xˉ)2
4、 X ˉ \bar{X} Xˉ 和 S 2 S^2 S2 相互独立。
这里顺便指出,虽然在 ( n − 1 ) S 2 / σ 2 = 1 σ 2 ∑ i = 1 n ( X i − X ˉ ) 2 (n-1)S^2/\sigma^2 = \frac{1}{\sigma^2} \sum_{i=1}^n (X_i - \bar{X})^2 (n−1)S2/σ2=σ21∑i=1n(Xi−Xˉ)2 中也包含了 n n n 个正态变量 ( X 1 − X ˉ ) , ( X 2 − X ˉ ) , ... , ( X n − X ˉ ) (X_1 - \bar{X}), (X_2 - \bar{X}), \dots, (X_n - \bar{X}) (X1−Xˉ),(X2−Xˉ),...,(Xn−Xˉ),但它们并不独立,而必须满足关系式: ∑ i = 1 n ( X i − X ˉ ) = 0 \sum_{i=1}^n (X_i - \bar{X}) = 0 i=1∑n(Xi−Xˉ)=0因而与 1 σ 2 ∑ i = 1 n ( X i − μ ) 2 \frac{1}{\sigma^2} \sum_{i=1}^n (X_i - \mu)^2 σ21∑i=1n(Xi−μ)2 相比,失去了一个自由度。为将问题说得更清楚,考虑 n = 2 n=2 n=2 情况。现在 X ˉ = 1 2 ( X 1 + X 2 ) \bar{X} = \frac{1}{2}(X_1 + X_2) Xˉ=21(X1+X2),因此: S 2 = ( X 1 − X ˉ ) 2 + ( X 2 − X ˉ ) 2 = 1 2 ( X 1 − X 2 ) 2 S^2 = (X_1 - \bar{X})^2 + (X_2 - \bar{X})^2 = \frac{1}{2}(X_1 - X_2)^2 S2=(X1−Xˉ)2+(X2−Xˉ)2=21(X1−X2)2显然 X 1 − X 2 ∼ N ( 0 , 2 σ 2 ) X_1 - X_2 \sim N(0, 2\sigma^2) X1−X2∼N(0,2σ2),即 X 1 − X 2 2 σ ∼ N ( 0 , 1 ) \frac{X_1 - X_2}{\sqrt{2}\sigma} \sim N(0, 1) 2 σX1−X2∼N(0,1),而得: ( n − 1 ) S 2 σ 2 = ( X 1 − X 2 ) 2 2 σ 2 ∼ χ 2 ( 1 ) \frac{(n-1)S^2}{\sigma^2} = \frac{(X_1 - X_2)^2}{2\sigma^2} \sim \chi^2(1) σ2(n−1)S2=2σ2(X1−X2)2∼χ2(1)
推论 1: T = X ˉ − μ S n ∼ t ( n − 1 ) T = \frac{\bar{X} - \mu}{S} \sqrt{n} \sim t(n-1) T=SXˉ−μn ∼t(n−1)
证明:由正态分布性质可知: X ˉ ∼ N ( μ , σ 2 n ) ⇒ X ˉ − μ σ / n ∼ N ( 0 , 1 ) \bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right) \Rightarrow \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \sim N(0,1) Xˉ∼N(μ,nσ2)⇒σ/n Xˉ−μ∼N(0,1)又 ∵ ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \because \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) ∵σ2(n−1)S2∼χ2(n−1),且由 X ˉ \bar{X} Xˉ 与 S 2 S^2 S2 相互独立,根据 t t t 分布的定义: ⇒ X ˉ − μ σ ⋅ n ( n − 1 ) S 2 σ 2 ( n − 1 ) = X ˉ − μ σ ⋅ n S σ = X ˉ − μ S ⋅ n ∼ t ( n − 1 ) \Rightarrow \frac{\frac{\bar{X} - \mu}{\sigma} \cdot \sqrt{n}}{\sqrt{\frac{(n-1)S^2}{\sigma^2(n-1)}}} = \frac{\frac{\bar{X} - \mu}{\sigma} \cdot \sqrt{n}}{\frac{S}{\sigma}} = \frac{\bar{X} - \mu}{S} \cdot \sqrt{n} \sim t(n-1) ⇒σ2(n−1)(n−1)S2 σXˉ−μ⋅n =σSσXˉ−μ⋅n =SXˉ−μ⋅n ∼t(n−1)
2️⃣ 不同正态总体的样本均值和样本方差的分布
推论2:设 ( X 1 , X 2 , ... , X n 1 ) (X_1, X_2, \dots, X_{n_1}) (X1,X2,...,Xn1) 是取自正态总体 N ( μ 1 , σ 1 2 ) N(\mu_1, \sigma_1^2) N(μ1,σ12) 的一个样本, ( Y 1 , Y 2 , ... , Y n 2 ) (Y_1, Y_2, \dots, Y_{n_2}) (Y1,Y2,...,Yn2) 是取自正态总体 N ( μ 2 , σ 2 2 ) N(\mu_2, \sigma_2^2) N(μ2,σ22) 的一个样本,且 ( X 1 , X 2 , ... , X n 1 ) (X_1, X_2, \dots, X_{n_1}) (X1,X2,...,Xn1) 和 ( Y 1 , Y 2 , ... , Y n 2 ) (Y_1, Y_2, \dots, Y_{n_2}) (Y1,Y2,...,Yn2) 相互独立,则:
(1) F = S 1 2 / σ 1 2 S 2 2 / σ 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F = \frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_2^2} \sim F(n_1 - 1, n_2 - 1) F=S22/σ22S12/σ12∼F(n1−1,n2−1)
证明:(1) 由前述定理可知 ( n 1 − 1 ) S 1 2 σ 1 2 ∼ χ 2 ( n 1 − 1 ) , ( n 2 − 1 ) S 2 2 σ 2 2 ∼ χ 2 ( n 2 − 1 ) \frac{(n_1 - 1)S_1^2}{\sigma_1^2} \sim \chi^2(n_1 - 1), \quad \frac{(n_2 - 1)S_2^2}{\sigma_2^2} \sim \chi^2(n_2 - 1) σ12(n1−1)S12∼χ2(n1−1),σ22(n2−1)S22∼χ2(n2−1)且 S 1 2 S_1^2 S12 和 S 2 2 S_2^2 S22 相互独立。故由 F F F 分布的定义: F = ( n 1 − 1 ) S 1 2 σ 1 2 / ( n 1 − 1 ) ( n 2 − 1 ) S 2 2 σ 2 2 / ( n 2 − 1 ) = S 1 2 / σ 1 2 S 2 2 / σ 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F = \frac{\frac{(n_1 - 1)S_1^2}{\sigma_1^2} \big/ (n_1 - 1)}{\frac{(n_2 - 1)S_2^2}{\sigma_2^2} \big/ (n_2 - 1)} = \frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_2^2} \sim F(n_1 - 1, n_2 - 1) F=σ22(n2−1)S22/(n2−1)σ12(n1−1)S12/(n1−1)=S22/σ22S12/σ12∼F(n1−1,n2−1)
(2) ( X ˉ − Y ˉ ) − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) \frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0,1) n1σ12+n2σ22 (Xˉ−Yˉ)−(μ1−μ2)∼N(0,1)
证明:
∵ X ˉ ∼ N ( μ 1 , σ 1 2 n 1 ) \because \bar{X} \sim N(\mu_1, \frac{\sigma_1^2}{n_1}) ∵Xˉ∼N(μ1,n1σ12) 与 Y ˉ ∼ N ( μ 2 , σ 2 2 n 2 ) \bar{Y} \sim N(\mu_2, \frac{\sigma_2^2}{n_2}) Yˉ∼N(μ2,n2σ22) 独立
∴ X ˉ − Y ˉ ∼ N ( μ 1 − μ 2 , σ 1 2 n 1 + σ 2 2 n 2 ) \therefore \bar{X} - \bar{Y} \sim N(\mu_1 - \mu_2, \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}) ∴Xˉ−Yˉ∼N(μ1−μ2,n1σ12+n2σ22)
(3) 若 σ 1 2 = σ 2 2 = σ 2 \sigma_1^2 = \sigma_2^2 = \sigma^2 σ12=σ22=σ2,有 T = ( X ˉ − Y ˉ ) − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) T = \frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2) T=Swn11+n21 (Xˉ−Yˉ)−(μ1−μ2)∼t(n1+n2−2)
其中相关统计量的定义为:
样本均值与样本方差: X ˉ = 1 n 1 ∑ i = 1 n 1 X i , S 1 2 = 1 n 1 − 1 ∑ i = 1 n 1 ( X i − X ˉ ) 2 \bar{X} = \frac{1}{n_1} \sum_{i=1}^{n_1} X_i, \quad S_1^2 = \frac{1}{n_1 - 1} \sum_{i=1}^{n_1} (X_i - \bar{X})^2 Xˉ=n11i=1∑n1Xi,S12=n1−11i=1∑n1(Xi−Xˉ)2 Y ˉ = 1 n 2 ∑ i = 1 n 2 Y i , S 2 2 = 1 n 2 − 1 ∑ i = 1 n 2 ( Y i − Y ˉ ) 2 \bar{Y} = \frac{1}{n_2} \sum_{i=1}^{n_2} Y_i, \quad S_2^2 = \frac{1}{n_2 - 1} \sum_{i=1}^{n_2} (Y_i - \bar{Y})^2 Yˉ=n21i=1∑n2Yi,S22=n2−11i=1∑n2(Yi−Yˉ)2
合并方差(Pooled Variance): S w 2 = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_w^2 = \frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2} Sw2=n1+n2−2(n1−1)S12+(n2−1)S22
证明: 由定理可知 X ˉ ∼ N ( μ 1 , σ 2 n 1 ) , ( n 1 − 1 ) S 1 2 σ 2 ∼ χ 2 ( n 1 − 1 ) \bar{X} \sim N(\mu_1, \frac{\sigma^2}{n_1}), \frac{(n_1-1)S_1^2}{\sigma^2} \sim \chi^2(n_1-1) Xˉ∼N(μ1,n1σ2),σ2(n1−1)S12∼χ2(n1−1),且 X ˉ \bar{X} Xˉ 与 S 1 2 S_1^2 S12 相互独立。 Y ˉ ∼ N ( μ 2 , σ 2 n 2 ) , ( n 2 − 1 ) S 2 2 σ 2 ∼ χ 2 ( n 2 − 1 ) \bar{Y} \sim N(\mu_2, \frac{\sigma^2}{n_2}), \frac{(n_2-1)S_2^2}{\sigma^2} \sim \chi^2(n_2-1) Yˉ∼N(μ2,n2σ2),σ2(n2−1)S22∼χ2(n2−1),且 Y ˉ \bar{Y} Yˉ 与 S 2 2 S_2^2 S22 相互独立。
又已知 ( X 1 , X 2 , ... , X n 1 ) (X_1, X_2, \dots, X_{n_1}) (X1,X2,...,Xn1) 和 ( Y 1 , Y 2 , ... , Y n 2 ) (Y_1, Y_2, \dots, Y_{n_2}) (Y1,Y2,...,Yn2) 相互独立,故 X ˉ , Y ˉ \bar{X}, \bar{Y} Xˉ,Yˉ 相互独立,于是: X ˉ − Y ˉ ∼ N ( μ 1 − μ 2 , σ 2 ( 1 n 1 + 1 n 2 ) ) \bar{X} - \bar{Y} \sim N\left(\mu_1 - \mu_2, \sigma^2\left(\frac{1}{n_1} + \frac{1}{n_2}\right)\right) Xˉ−Yˉ∼N(μ1−μ2,σ2(n11+n21))所以: X ˉ − Y ˉ − ( μ 1 − μ 2 ) σ 1 n 1 + 1 n 2 ∼ N ( 0 , 1 ) \frac{\bar{X} - \bar{Y} - (\mu_1 - \mu_2)}{\sigma \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim N(0,1) σn11+n21 Xˉ−Yˉ−(μ1−μ2)∼N(0,1)另一方面,由 S 1 2 , S 2 2 S_1^2, S_2^2 S12,S22 的独立性及 χ 2 \chi^2 χ2 分布的可加性知: ( n 1 − 1 ) S 1 2 σ 2 + ( n 2 − 1 ) S 2 2 σ 2 = ( n 1 + n 2 − 2 ) S w 2 σ 2 ∼ χ 2 ( n 1 + n 2 − 2 ) \frac{(n_1 - 1)S_1^2}{\sigma^2} + \frac{(n_2 - 1)S_2^2}{\sigma^2} = \frac{(n_1 + n_2 - 2)S_w^2}{\sigma^2} \sim \chi^2(n_1 + n_2 - 2) σ2(n1−1)S12+σ2(n2−1)S22=σ2(n1+n2−2)Sw2∼χ2(n1+n2−2)又 X ˉ \bar{X} Xˉ 与 S 2 2 , Y ˉ S_2^2, \bar{Y} S22,Yˉ 与 S 1 2 S_1^2 S12 也是相互独立的,因而 X ˉ − Y ˉ \bar{X} - \bar{Y} Xˉ−Yˉ 与 S w 2 S_w^2 Sw2 相互独立。故按 t t t 分布的定义可知: T = X ˉ − Y ˉ − ( μ 1 − μ 2 ) σ 1 n 1 + 1 n 2 ( n 1 + n 2 − 2 ) S w 2 ( n 1 + n 2 − 2 ) σ 2 = X ˉ − Y ˉ − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) T = \frac{\frac{\bar{X} - \bar{Y} - (\mu_1 - \mu_2)}{\sigma \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}}{\sqrt{\frac{(n_1 + n_2 - 2)S_w^2}{(n_1 + n_2 - 2)\sigma^2}}} = \frac{\bar{X} - \bar{Y} - (\mu_1 - \mu_2)}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2) T=(n1+n2−2)σ2(n1+n2−2)Sw2 σn11+n21 Xˉ−Yˉ−(μ1−μ2)=Swn11+n21 Xˉ−Yˉ−(μ1−μ2)∼t(n1+n2−2)
1.5 充分统计量和完备统计量
1.5.1 充分统计量
例 1:为了解产品的不合格率 p p p,检验员随机抽取了 10 件产品进行检查,发现第 3 件和第 9 件为不合格品,记作 X 3 = 1 , X 9 = 1 X_3 = 1, X_9 = 1 X3=1,X9=1,其余都是合格品,记 X i = 0 , i = 1 , 2 , ... , 10 X_i = 0, i = 1, 2, \dots, 10 Xi=0,i=1,2,...,10,且 i ≠ 3 , i ≠ 9 i \neq 3, i \neq 9 i=3,i=9。当领导问及检验结果时,检验员作了如下二种回答:
(1)10 件产品中有 2 件不合格品,即 ∑ i = 1 10 X i = 2 \sum_{i=1}^{10} X_i = 2 ∑i=110Xi=2;
(2)第 9 件产品不合格,即 X 9 = 1 X_9 = 1 X9=1。
1️⃣ 充分统计量的定义
定义:设 ( X 1 , ... , X n ) (X_1, \dots, X_n) (X1,...,Xn) 是从具有分布族 { F ( x ; θ ) : θ ∈ Θ } \{F(x; \theta) : \theta \in \Theta\} {F(x;θ):θ∈Θ} 的总体中抽取的一个样本, T ( X 1 , ... , X n ) T(X_1, \dots, X_n) T(X1,...,Xn) 是一统计量.如果在给定 T ( X 1 , ... , X n ) = t T(X_1, \dots, X_n) = t T(X1,...,Xn)=t 下, ( X 1 , ... , X n ) (X_1, \dots, X_n) (X1,...,Xn) 的条件分布与未知参数 θ \theta θ 无关,则称统计量 T ( X 1 , ... , X n ) T(X_1, \dots, X_n) T(X1,...,Xn) 是分布族 { F ( x ; θ ) : θ ∈ Θ } \{F(x; \theta) : \theta \in \Theta\} {F(x;θ):θ∈Θ} 的充分统计量,或称它是 θ \theta θ 的充分统计量。
例1续:证明 (1)的表示 T 1 = ∑ i = 1 n X i T_1 = \sum_{i=1}^n X_i T1=∑i=1nXi 是 p p p 的充分统计量,而 (2)的表示 T 2 = X j T_2 = X_j T2=Xj 不是充分统计量。
证明:对于两点分布总体 X X X, P { X = x } = p x ( 1 − p ) 1 − x , x = 0 , 1 P\{X = x\} = p^x(1 - p)^{1-x}, x = 0, 1 P{X=x}=px(1−p)1−x,x=0,1 ∴ \therefore ∴ 其样本的联合分布为: P { X 1 = x 1 , ... , X n = x n } = p ∑ i = 1 n x i ( 1 − p ) n − ∑ i = 1 n x i P\{X_1 = x_1, \dots, X_n = x_n\} = p^{\sum_{i=1}^n x_i} (1 - p)^{n - \sum_{i=1}^n x_i} P{X1=x1,...,Xn=xn}=p∑i=1nxi(1−p)n−∑i=1nxi
其中 x i = 0 , 1 x_i = 0, 1 xi=0,1。统计量 T 1 = ∑ i = 1 n X i ∼ b ( n , p ) T_1 = \sum_{i=1}^n X_i \sim b(n, p) T1=∑i=1nXi∼b(n,p)(服从二项分布);
在 T 1 = k T_1 = k T1=k 下的条件分布为: P r { X 1 = x 1 , ... , X n = x n ∣ T 1 = k ; p } = P r { X 1 = x 1 , ... , X n = x n , ∑ i = 1 n X i = k ; p } P r { T 1 = k ; p } Pr\{X_1 = x_1, \dots, X_n = x_n \mid T_1 = k; p\} = \frac{Pr\{X_1 = x_1, \dots, X_n = x_n, \sum_{i=1}^n X_i = k; p\}}{Pr\{T_1 = k; p\}} Pr{X1=x1,...,Xn=xn∣T1=k;p}=Pr{T1=k;p}Pr{X1=x1,...,Xn=xn,∑i=1nXi=k;p}当 ∑ x i = k \sum x_i = k ∑xi=k 时,分子就是联合概率,分母是二项分布的概率公式: = p k ( 1 − p ) n − k ( n k ) p k ( 1 − p ) n − k = 1 ( n k ) = \frac{p^k (1 - p)^{n-k}}{\binom{n}{k} p^k (1 - p)^{n-k}} = \frac{1}{\binom{n}{k}} =(kn)pk(1−p)n−kpk(1−p)n−k=(kn)1该结果与 p p p 无关,所以 T 1 = ∑ i = 1 n X i T_1 = \sum_{i=1}^n X_i T1=∑i=1nXi 是两点分布的充分统计量。
在给定 T 2 = X j = k T_2 = X_j = k T2=Xj=k 条件下,样本 ( X 1 , ... , X n ) (X_1, \dots, X_n) (X1,...,Xn) 的条件分布: P { X 1 = x 1 , ... , X n = x n ∣ X j = k } P\{X_1 = x_1, \dots, X_n = x_n \mid X_j = k\} P{X1=x1,...,Xn=xn∣Xj=k} = p ∑ i ≠ j x i ( 1 − p ) n − 1 − ∑ i ≠ j x i p k ( 1 − p ) 1 − k p k ( 1 − p ) 1 − k = p ∑ i ≠ j x i ( 1 − p ) n − 1 − ∑ i ≠ j x i = \frac{p^{\sum_{i \neq j} x_i} (1 - p)^{n-1-\sum_{i \neq j} x_i} p^k (1 - p)^{1-k}}{p^k (1 - p)^{1-k}} = p^{\sum_{i \neq j} x_i} (1 - p)^{n-1-\sum_{i \neq j} x_i} =pk(1−p)1−kp∑i=jxi(1−p)n−1−∑i=jxipk(1−p)1−k=p∑i=jxi(1−p)n−1−∑i=jxi与 p p p 有关,可见 T 2 = X j T_2 = X_j T2=Xj 不是充分统计量.
2️⃣ 因子分解定理
定理: 设总体 X X X 具有分布密度族 { f ( x ; θ ) : θ ∈ Θ } \{f(x; \theta) : \theta \in \Theta\} {f(x;θ):θ∈Θ}, ( X 1 , ... , X n ) (X_1, \dots, X_n) (X1,...,Xn) 取自 X X X 的一个样本,则统计量 T ( X 1 , ... , X n ) T(X_1, \dots, X_n) T(X1,...,Xn) 为 θ \theta θ 的充分统计量的充分必要条件为:样本的联合分布密度函数可分解为: L ( x 1 , ... , x n ; θ ) = ∏ i = 1 n f ( x i ; θ ) = h ( x 1 , ... , x n ) g ( T ( x 1 , ... , x n ) , θ ) L(x_1, \dots, x_n; \theta) = \prod_{i=1}^n f(x_i; \theta) = h(x_1, \dots, x_n) g(T(x_1, \dots, x_n), \theta) L(x1,...,xn;θ)=i=1∏nf(xi;θ)=h(x1,...,xn)g(T(x1,...,xn),θ)
其中: h ( x 1 , ... , x n ) h(x_1, \dots, x_n) h(x1,...,xn) 是非负函数且与 θ \theta θ 无关; g ( T ( x 1 , ... , x n ) , θ ) g(T(x_1, \dots, x_n), \theta) g(T(x1,...,xn),θ) 仅通过 T ( x 1 , ... , x n ) = t T(x_1, \dots, x_n) = t T(x1,...,xn)=t 依赖于样本 ( x 1 , ... , x n ) (x_1, \dots, x_n) (x1,...,xn)。
例3: 设 ( X 1 , ... , X n ) (X_1, \dots, X_n) (X1,...,Xn) 是取自两点分布 b ( 1 , p ) b(1, p) b(1,p) 总体的一个样本,其联合概率分布为: P { X = x 1 , ... , X n = x n ; p } = p ∑ i = 1 n x i ( 1 − p ) n − ∑ i = 1 n x i = ( 1 − p ) n ( p 1 − p ) ∑ i = 1 n x i P\{X = x_1, \dots, X_n = x_n; p\} = p^{\sum_{i=1}^n x_i} (1 - p)^{n - \sum_{i=1}^n x_i}= (1 - p)^n \left( \frac{p}{1 - p} \right)^{\sum_{i=1}^n x_i} P{X=x1,...,Xn=xn;p}=p∑i=1nxi(1−p)n−∑i=1nxi=(1−p)n(1−pp)∑i=1nxi
令: T ( x 1 , ... , x n ) = ∑ i = 1 n x i T(x_1, \dots, x_n) = \sum_{i=1}^n x_i T(x1,...,xn)=∑i=1nxi, h ( x 1 , ... , x n ) = 1 h(x_1, \dots, x_n) = 1 h(x1,...,xn)=1, g ( T ( x 1 , ... , x n ) , p ) = ( 1 − p ) n ( p 1 − p ) T g(T(x_1, \dots, x_n), p) = (1 - p)^n \left( \frac{p}{1 - p} \right)^T g(T(x1,...,xn),p)=(1−p)n(1−pp)T由因子分解定理可知 T ( X 1 , ... , X n ) = ∑ i = 1 n X i T(X_1, \dots, X_n) = \sum_{i=1}^n X_i T(X1,...,Xn)=∑i=1nXi 是 p p p 的充分统计量.
例4: 设 X ∼ N ( μ , 1 ) , − ∞ < μ < + ∞ X \sim N(\mu, 1), -\infty < \mu < +\infty X∼N(μ,1),−∞<μ<+∞ 为未知参数,证明 X ˉ \bar{X} Xˉ 是 μ \mu μ 的充分统计量。
证: X 1 , ... , X n X_1, \dots, X_n X1,...,Xn 的联合分布密度为: ∏ i = 1 n f ( x i ; θ ) = ( 1 2 π ) n exp { − 1 2 ∑ i = 1 n ( x i − μ ) 2 } \prod_{i=1}^n f(x_i; \theta) = \left( \frac{1}{\sqrt{2\pi}} \right)^n \exp \left\{ -\frac{1}{2} \sum_{i=1}^n (x_i - \mu)^2 \right\} i=1∏nf(xi;θ)=(2π 1)nexp{−21i=1∑n(xi−μ)2}而利用离差平方和公式可得: ∑ i = 1 n ( x i − μ ) 2 = ∑ i = 1 n ( x i − x ˉ ) 2 + n ( x ˉ − μ ) 2 \sum_{i=1}^n (x_i - \mu)^2 = \sum_{i=1}^n (x_i - \bar{x})^2 + n(\bar{x} - \mu)^2 i=1∑n(xi−μ)2=i=1∑n(xi−xˉ)2+n(xˉ−μ)2
所以原式可变形为: 原式 = ( 1 2 π ) n exp { − 1 2 ∑ i = 1 n ( x i − x ˉ ) 2 } exp { − 1 2 n ( x ˉ − μ ) 2 } \text{原式} = \left( \frac{1}{\sqrt{2\pi}} \right)^n \exp \left\{ -\frac{1}{2} \sum_{i=1}^n (x_i - \bar{x})^2 \right\} \exp \left\{ -\frac{1}{2} n(\bar{x} - \mu)^2 \right\} 原式=(2π 1)nexp{−21i=1∑n(xi−xˉ)2}exp{−21n(xˉ−μ)2}
取: h ( x 1 , ... , x n ) = exp { − 1 2 ∑ i = 1 n ( x i − x ˉ ) 2 } h(x_1, \dots, x_n) = \exp \left\{ -\frac{1}{2} \sum_{i=1}^n (x_i - \bar{x})^2 \right\} h(x1,...,xn)=exp{−21∑i=1n(xi−xˉ)2},
g ( T ( x 1 , ... , x n ) , μ ) = ( 1 2 π ) n exp { − 1 2 n ( x ˉ − μ ) 2 } g(T(x_1, \dots, x_n), \mu) = \left( \frac{1}{\sqrt{2\pi}} \right)^n \exp \left\{ -\frac{1}{2} n(\bar{x} - \mu)^2 \right\} g(T(x1,...,xn),μ)=(2π 1)nexp{−21n(xˉ−μ)2}
由因子分解定理可知, X ˉ \bar{X} Xˉ 是 μ \mu μ 的充分统计量。
3️⃣ 联合充分统计量定义
定义: 若分布有 n n n 个参数,则 θ \theta θ 是参数向量,由因子分解定理条件成立,则称 T ( X 1 , ... , X n ) T(X_1, \dots, X_n) T(X1,...,Xn) 为关于 θ \theta θ 的联合充分统计量。
例 5:设 X ∼ N ( μ , σ 2 ) , θ = ( μ , σ 2 ) X \sim N(\mu, \sigma^2), \theta = (\mu, \sigma^2) X∼N(μ,σ2),θ=(μ,σ2) 是未知参数向量,证 ( X ˉ , ∑ i = 1 n X i 2 ) (\bar{X}, \sum_{i=1}^n X_i^2) (Xˉ,∑i=1nXi2) 是 ( μ , σ 2 ) (\mu, \sigma^2) (μ,σ2) 的联合充分统计量。
注: T ( X 1 , ... , X n ) T(X_1, \dots, X_n) T(X1,...,Xn) 是 θ \theta θ 的联合充分统计量不能推出 T i T_i Ti 是 θ i \theta_i θi 的充分统计量。因此不能说明 X ˉ , ∑ i = 1 n X i 2 \bar{X}, \sum_{i=1}^n X_i^2 Xˉ,∑i=1nXi2 分别是 μ , σ 2 \mu, \sigma^2 μ,σ2 的充分统计量。
证: ( X 1 , ... , X n ) (X_1, \dots, X_n) (X1,...,Xn) 是取自总体的一个样本,其联合密度函数为 L ( x 1 , ... , x n ; θ ) = ∏ i = 1 n f ( x i ; θ ) L(x_1, \dots, x_n; \theta) = \prod_{i=1}^n f(x_i; \theta) L(x1,...,xn;θ)=i=1∏nf(xi;θ) = 1 ( 2 π σ ) n exp { − 1 2 σ 2 ∑ i = 1 n ( x i − μ ) 2 } = \frac{1}{(\sqrt{2\pi}\sigma)^n} \exp \left\{ -\frac{1}{2\sigma^2} \sum_{i=1}^n (x_i - \mu)^2 \right\} =(2π σ)n1exp{−2σ21i=1∑n(xi−μ)2} = 1 ( 2 π σ ) n exp { − 1 2 σ 2 ∑ i = 1 n x i 2 + n μ σ 2 x ˉ − n μ 2 2 σ 2 } = \frac{1}{(\sqrt{2\pi}\sigma)^n} \exp \left\{ -\frac{1}{2\sigma^2} \sum_{i=1}^n x_i^2 + \frac{n\mu}{\sigma^2}\bar{x} - \frac{n\mu^2}{2\sigma^2} \right\} =(2π σ)n1exp{−2σ21i=1∑nxi2+σ2nμxˉ−2σ2nμ2}取: h ( x 1 , ... , x n ) = 1 h(x_1, \dots, x_n) = 1 h(x1,...,xn)=1, g ( T ( x 1 , ... , x n ) , θ ) = 1 ( 2 π σ ) n exp { − 1 2 σ 2 ∑ i = 1 n x i 2 + n μ σ 2 x ˉ − n μ 2 2 σ 2 } g(T(x_1, \dots, x_n), \theta) = \frac{1}{(\sqrt{2\pi}\sigma)^n} \exp \left\{ -\frac{1}{2\sigma^2} \sum_{i=1}^n x_i^2 + \frac{n\mu}{\sigma^2}\bar{x} - \frac{n\mu^2}{2\sigma^2} \right\} g(T(x1,...,xn),θ)=(2π σ)n1exp{−2σ21∑i=1nxi2+σ2nμxˉ−2σ2nμ2}
由因子分解定理可知: T ( X 1 , ... , X n ) = ( X ˉ , ∑ i = 1 n X i 2 ) T(X_1, \dots, X_n) = \left( \bar{X}, \sum_{i=1}^n X_i^2 \right) T(X1,...,Xn)=(Xˉ,∑i=1nXi2) 是 θ = ( μ , σ 2 ) \theta = (\mu, \sigma^2) θ=(μ,σ2) 的联合充分统计量。
1.5.2 完备统计量
1️⃣ 分布族的完备性
定义 :设 { F ( x ; θ ) : θ ∈ Θ } \{F(x; \theta) : \theta \in \Theta\} {F(x;θ):θ∈Θ} 是一个分布族,如果由 E θ [ g ( X ) ] = 0 , 对一切 θ ∈ Θ , E_\theta[g(X)] = 0, \quad \text{对一切 } \theta \in \Theta, Eθ[g(X)]=0,对一切 θ∈Θ,
总可推出 P r θ { g ( X ) = 0 } = 1 , 对一切 θ ∈ Θ , Pr_\theta\{g(X) = 0\} = 1, \quad \text{对一切 } \theta \in \Theta, Prθ{g(X)=0}=1,对一切 θ∈Θ,
则称分布族 { F ( x ; θ ) : θ ∈ Θ } \{F(x; \theta) : \theta \in \Theta\} {F(x;θ):θ∈Θ} 是完备的(Completeness)。
完备性概念是 E. L. Lahmann 和 H. Scheffe 于 1950 年提出来的。
例1 :二项分布族 { b ( n , p ) : 0 < p < 1 } \{b(n, p) : 0 < p < 1\} {b(n,p):0<p<1} 是完备的。
设函数 g ( x ) g(x) g(x) 满足: E p [ g ( X ) ] = ∑ x = 0 n g ( x ) ( n x ) p x ( 1 − p ) n − x = 0 , 对任 0 < p < 1 , E_p[g(X)] = \sum_{x=0}^n g(x) \binom{n}{x} p^x (1 - p)^{n-x} = 0, \quad \text{对任 } 0 < p < 1, Ep[g(X)]=x=0∑ng(x)(xn)px(1−p)n−x=0,对任 0<p<1,
进行变形(等号两边同除以 ( 1 − p ) n (1-p)^n (1−p)n): ⇔ ∑ x = 0 n g ( x ) ( n x ) ( p 1 − p ) x = 0 , 对一切 0 < p < 1 , \Leftrightarrow \sum_{x=0}^n g(x) \binom{n}{x} \left( \frac{p}{1 - p} \right)^x = 0, \quad \text{对一切 } 0 < p < 1, ⇔x=0∑ng(x)(xn)(1−pp)x=0,对一切 0<p<1,
上式是关于 p 1 − p \frac{p}{1 - p} 1−pp 的多项式,由于该多项式在区间内恒等于零,因此它的各项系数必为零,即: g ( x ) = 0 , x = 0 , 1 , ... , n . g(x) = 0, \quad x = 0, 1, \dots, n. g(x)=0,x=0,1,...,n.所以二项分布族是完备的。
例2 :正态分布族 { N ( 0 , σ 2 ) : σ 2 > 0 } \{N(0, \sigma^2) : \sigma^2 > 0\} {N(0,σ2):σ2>0} 是不完备的。
要说明一个分布族是不完备的,只要能找到这样一个函数 g ( x ) g(x) g(x),虽满足 E θ [ g ( X ) ] = 0 E_\theta[g(X)] = 0 Eθ[g(X)]=0,对一切 θ ∈ Θ \theta \in \Theta θ∈Θ,但 g ( x ) g(x) g(x) 本身不是几乎处处为零的函数。
因为这个分布族中任一密度函数都是偶函数,故对任一奇函数,例如 g ( x ) = x g(x) = x g(x)=x,就有: E σ [ g ( X ) ] = E σ ( X ) = 0 , 对一切 σ > 0 , E_\sigma[g(X)] = E_\sigma(X) = 0, \quad \text{对一切 } \sigma > 0, Eσ[g(X)]=Eσ(X)=0,对一切 σ>0,但显然 P σ { X ≠ 0 } = 1 P_\sigma\{X \neq 0\} = 1 Pσ{X=0}=1,故分布族 { N ( 0 , σ 2 ) : σ 2 > 0 } \{N(0, \sigma^2) : \sigma^2 > 0\} {N(0,σ2):σ2>0} 不完备。
2️⃣ 完备统计量
定义 : ( X 1 , X 2 , ... , X n ) (X_1, X_2, \dots, X_n) (X1,X2,...,Xn) 是取自分布族 { F ( x ; θ ) : θ ∈ Θ } \{F(x; \theta) : \theta \in \Theta\} {F(x;θ):θ∈Θ} 的一个样本,若统计量 T ( X 1 , X 2 , ... , X n ) T(X_1, X_2, \dots, X_n) T(X1,X2,...,Xn) 的对应分布族 { F T ( t ; θ ) : θ ∈ Θ } \{F^T(t; \theta) : \theta \in \Theta\} {FT(t;θ):θ∈Θ} 是完备的,则称统计量 T T T 是完备的。
由例1立即可见:对两点分布族 { b ( 1 , p ) : 0 < p < 1 } \{b(1, p) : 0 < p < 1\} {b(1,p):0<p<1},统计量 T = ∑ i = 1 n X i T = \sum_{i=1}^n X_i T=∑i=1nXi 的对应分布族 { b ( n , p ) : 0 < p < 1 } \{b(n, p) : 0 < p < 1\} {b(n,p):0<p<1} 是完备的,故 T T T 是完备统计量。
在上述完备统计量的定义中:并没有要求原分布族的完备性。可能有原分布族是不完备的,但对应分布族却是完备的情况,一个统计量是否完备由统计量本身的构造决定。
例 3: 在例 2 中已经证明 { N ( 0 , σ 2 ) : σ 2 > 0 } \{N(0, \sigma^2) : \sigma^2 > 0\} {N(0,σ2):σ2>0} 是不完备的,现在证明对这个分布族, T = ∑ i = 1 n X i 2 T = \sum_{i=1}^n X_i^2 T=∑i=1nXi2 是完备统计量。
证明:事实上,由定理知 T / σ 2 = ∑ i = 1 n X i 2 / σ 2 ∼ χ 2 ( n ) T / \sigma^2 = \sum_{i=1}^n X_i^2 / \sigma^2 \sim \chi^2(n) T/σ2=∑i=1nXi2/σ2∼χ2(n),则 T = ∑ i = 1 n X i 2 T = \sum_{i=1}^n X_i^2 T=∑i=1nXi2 的密度函数为: f ( t ; σ 2 ) = 1 2 n / 2 σ n Γ ( n / 2 ) e − t / 2 σ 2 t n / 2 − 1 , t > 0. f(t; \sigma^2) = \frac{1}{2^{n/2} \sigma^n \Gamma(n/2)} e^{-t/2\sigma^2} t^{n/2-1}, \quad t > 0. f(t;σ2)=2n/2σnΓ(n/2)1e−t/2σ2tn/2−1,t>0.若函数 g ( t ) g(t) g(t) 满足 E θ [ g ( T ) ] = 0 E_{\theta}[g(T)] = 0 Eθ[g(T)]=0,即: ∫ 0 ∞ g ( t ) t n / 2 − 1 e − t / 2 σ 2 d t = 0 , 对任 σ 2 > 0 , \int_0^{\infty} g(t) t^{n/2-1} e^{-t/2\sigma^2} dt = 0, \quad \text{对任 } \sigma^2 > 0, ∫0∞g(t)tn/2−1e−t/2σ2dt=0,对任 σ2>0,可以证明(利用 Laplace 变换的唯一性),此时一定有: g ( t ) t n / 2 − 1 = 0 , t > 0 , a.s. (几乎处处) g(t) t^{n/2-1} = 0, \quad t > 0, \text{ a.s. (几乎处处)} g(t)tn/2−1=0,t>0, a.s. (几乎处处)当 t > 0 t > 0 t>0 时, t n 2 − 1 t^{\frac{n}{2}-1} t2n−1 不恒为零,所以 g ( t ) = 0 , a.s. g(t) = 0, \text{ a.s.} g(t)=0, a.s.。故 T T T 的对应分布族 { f ( t , σ 2 ) : σ 2 > 0 } \{f(t, \sigma^2) : \sigma^2 > 0\} {f(t,σ2):σ2>0} 是完备的,从而统计量 T = ∑ i = 1 n X i 2 T = \sum_{i=1}^n X_i^2 T=∑i=1nXi2 是完备统计量.
3️⃣ 充分完备统计量
许多理论性的统计问题在指数族中有满意的解决。譬如,由前面的几个例子可以看出,寻找和验证分布族的充分完备统计量一般是很麻烦的,但在指数族中却是很方便的,有以下定理。
定义: 设 { f ( x ; θ ) : θ = ( θ 1 , θ 2 , ... , θ k ) ∈ Θ } \{f(x; \theta) : \theta = (\theta_1, \theta_2, \dots, \theta_k) \in \Theta\} {f(x;θ):θ=(θ1,θ2,...,θk)∈Θ} 是 k k k 个参数的指数族,样本 ( X 1 , X 2 , ... , X n ) (X_1, X_2, \dots, X_n) (X1,X2,...,Xn) 的联合分布密度具有如下形式: L ( x 1 , x 2 , ... , x n ; θ ) = a ( θ ) exp { ∑ j = 1 k Q j ( θ ) T j ( x 1 , x 2 , ... , x n ) } h ( x 1 , x 2 , ... , x n ) , L(x_1, x_2, \dots, x_n; \theta) = a(\theta) \exp \left\{ \sum_{j=1}^k Q_j(\theta) T_j(x_1, x_2, \dots, x_n) \right\} h(x_1, x_2, \dots, x_n), L(x1,x2,...,xn;θ)=a(θ)exp{j=1∑kQj(θ)Tj(x1,x2,...,xn)}h(x1,x2,...,xn),
如果 Θ \Theta Θ 包含有一个 k k k 维矩形,且 Q = ( Q 1 , Q 2 , ... , Q k ) Q = (Q_1, Q_2, \dots, Q_k) Q=(Q1,Q2,...,Qk) 的值域包含有一个 k k k 维开集,则: T ( X 1 , X 2 , ... , X n ) = ( T 1 ( X 1 , X 2 , ... , X n ) , ... , T k ( X 1 , X 2 , ... , X n ) ) T(X_1, X_2, \dots, X_n) = (T_1(X_1, X_2, \dots, X_n), \dots, T_k(X_1, X_2, \dots, X_n)) T(X1,X2,...,Xn)=(T1(X1,X2,...,Xn),...,Tk(X1,X2,...,Xn))
是 k k k 维参数向量 θ = ( θ 1 , θ 2 , ... , θ k ) \theta = (\theta_1, \theta_2, \dots, \theta_k) θ=(θ1,θ2,...,θk) 的充分完备统计量。
例4 : 设 ( X 1 , X 2 , ... , X n ) (X_1, X_2, \dots, X_n) (X1,X2,...,Xn) 是取自 Poisson 分布族 { P ( λ ) : λ > 0 } \{P(\lambda) : \lambda > 0\} {P(λ):λ>0} 的样本,它的联合概率分布为: Pr { X 1 = x 1 , ... , X n = x n ; λ } = e − n λ λ ∑ i = 1 n x i x 1 ! ... x n ! \text{Pr}\{X_1 = x_1, \dots, X_n = x_n; \lambda\} = e^{-n\lambda} \frac{\lambda^{\sum_{i=1}^n x_i}}{x_1! \dots x_n!} Pr{X1=x1,...,Xn=xn;λ}=e−nλx1!...xn!λ∑i=1nxi = e − n λ exp ( ln λ ⋅ ∑ i = 1 n x i ) 1 x 1 ! ... x n ! = e^{-n\lambda} \exp \left( \ln \lambda \cdot \sum_{i=1}^n x_i \right) \frac{1}{x_1! \dots x_n!} =e−nλexp(lnλ⋅i=1∑nxi)x1!...xn!1
由定义易知 Poisson 分布族 { P ( λ ) : λ > 0 } \{P(\lambda) : \lambda > 0\} {P(λ):λ>0} 是单参数指数族, Θ = { λ : λ > 0 } \Theta = \{\lambda : \lambda > 0\} Θ={λ:λ>0} 包含一维开区间, Q ( λ ) = ln λ Q(\lambda) = \ln \lambda Q(λ)=lnλ 的值域 ( − ∞ , ∞ ) (-\infty, \infty) (−∞,∞) 包含一维开区间.故由定理可知: T ( X 1 , X 2 , ... , X n ) = ∑ i = 1 n X i T(X_1, X_2, \dots, X_n) = \sum_{i=1}^n X_i T(X1,X2,...,Xn)=i=1∑nXi
是 λ \lambda λ 的充分完备统计量.
例5 : 设 ( X 1 , X 2 , ... , X n ) (X_1, X_2, \dots, X_n) (X1,X2,...,Xn) 是取自正态分布族 { N ( μ , σ 2 ) : − ∞ < μ < ∞ , σ 2 > 0 } \{N(\mu, \sigma^2) : -\infty < \mu < \infty, \sigma^2 > 0\} {N(μ,σ2):−∞<μ<∞,σ2>0} 的样本,它的联合分布密度为: L ( x 1 , x 2 , ... , x n ; μ , σ 2 ) = 1 ( 2 π σ ) n exp [ − 1 2 σ 2 ∑ i = 1 n ( x i − μ ) 2 ] L(x_1, x_2, \dots, x_n; \mu, \sigma^2) = \frac{1}{(\sqrt{2\pi}\sigma)^n} \exp \left[ -\frac{1}{2\sigma^2} \sum_{i=1}^n (x_i - \mu)^2 \right] L(x1,x2,...,xn;μ,σ2)=(2π σ)n1exp[−2σ21i=1∑n(xi−μ)2] = 1 ( 2 π σ ) n exp ( − 1 2 σ 2 ∑ i = 1 n x i 2 + μ σ 2 ∑ i = 1 n x i ) ⋅ exp ( − n μ 2 2 σ 2 ) , = \frac{1}{(\sqrt{2\pi}\sigma)^n} \exp \left( -\frac{1}{2\sigma^2} \sum_{i=1}^n x_i^2 + \frac{\mu}{\sigma^2} \sum_{i=1}^n x_i \right) \cdot \exp \left( -\frac{n\mu^2}{2\sigma^2} \right), =(2π σ)n1exp(−2σ21i=1∑nxi2+σ2μi=1∑nxi)⋅exp(−2σ2nμ2),
由前例知,正态分布族 { N ( μ , σ 2 ) : − ∞ < μ < ∞ , σ 2 > 0 } \{N(\mu, \sigma^2) : -\infty < \mu < \infty, \sigma^2 > 0\} {N(μ,σ2):−∞<μ<∞,σ2>0} 是指数族
由定理, ( ∑ i = 1 n X i , ∑ i = 1 n X i 2 ) \left( \sum_{i=1}^n X_i, \sum_{i=1}^n X_i^2 \right) (∑i=1nXi,∑i=1nXi2) 是 ( μ , σ 2 ) (\mu, \sigma^2) (μ,σ2) 的充分完备统计量.