第五章 数理统计的基础知识
由于大量随机现象必然呈现出它的规律性,故理论上只要对随机现象进行足够多次的观察,研究对象的规律性就一定能清楚地呈现出来,但实际上人们常常无法对所研究的对象的全体(或总体)进行观察,而只能抽取其中的部分(或样本)进行观察或试验以获得有限的数据.
5.1 数理统计的基本概念
一、总体与总体分布
在数理统计中,把研究的问题所涉及的对象的全体所组成的集合称为总体 (或母体 ).把构成总体的每一个成员(或元素)称为个体 .总体中所包含的个体的数量称为总体的容量 .容量为有限的称为有限总体 ;容量为无限的称为无限总体 .总体与个体之间的关系,即集合与元素之间的关系
定义1:统计学中称随机变量(或向量)X为总体 ,并把随机变量(或向量)的分布称为总体分布
二、样本与样本分布
- 一般的方法是按一定原则从总体中抽取若干个个体进行观察,这个过程叫做抽样 .显然,对每个个体的观察结果是随机的,可将其看成是一个随机变量的取值,这样就把每个个体的观察结果与一个随机变量的取值对应起来了.于是,我们可记从总体X中第i次抽取的个体指标为Xi(i=1,2,n)则Xi是一个随机变量;记x~i~(i=1,2,...,n)为个体指标Xi的具体观察值,我们称X1,X2,...,Xn为总体X的 样本 ;称样本观察值x~1~,x~2~,...,x~n~为 样本值 ;样本所含个体数目称为样本容量(或样本大小)。
- 为了使抽取的样本能很好地反映总体的信息,除了对样本容量有一定的要求外还对样本的抽取方式有一定的要求,最常用的一种抽样方法称为简单随机抽样.它要求抽取的样本 满足下面两个条件 :
(1)代表性 :X,X2,...,Xn与所考察的总体具有相同的分布;
(2)独立 性:X1,X2,...,Xn,是相互独立 的随机变量.
由简单随机抽样得到的样本称为简单随机样本,它可用与总体同分布的n个相互独立的随机变量X1,X2,...,Xn表示,显然,简单随机样本是一种非常理想化的样本,在实际应用中要获得严格意义下的简单随机样本并不容易.
六、统计量
- 定义3:设X,X2,Xn为总体X的一个样本,称此样本的任一不含总体分布未知参数 的函数为该样本的统计量,
- 例如,设总体X服从正态分布,E(X)=5,D(X)=σ^2^,σ^2^未知.X~1~,X~2~,X~n~,为总体X的一个样本,令
Sn=X1+X2+...+Xn,
则Sn,与¯X均为样本X~1~,X~2~,...,X~n~,的统计量.但U=nμ(¯X-5)/σ不是该样本的统计量,
因其含有总体分布中的未知参数μ,σ,
七、常用统计量
以下设X1,X2,...,Xn为总体X的一个样本.
- 1.样本均值
- 2.样本方差
未修正的样本方差
修正的样本方差
3.样本标准差
4.样本(k阶)原点矩
一节原点矩就是样本均值
5.样本(k阶)中心矩
其中样本二阶中心矩
又称作未修正样本方差.
注:上述五种统计量可统称为矩统计量 ,简称为样本矩,它们都是样本的显函数它们的观察值仍分别称为样本均值、样本方差、样本标准差、样本(k阶)原点矩、样本(k阶)中心矩.
5.2 常用的统计分布
一、分位数
-
设随机变量X的分布函数为F(x),对给定的实数α(0<α<1),若实数F~α~。满足
P(X>F~α~)=α,
则称F~α~为随机变量X分布的水平的上侧分位数 .
若实数T~α/2~满足
P{|X|>T~α/2~}=α,
则称T~α/2~为随机变量X分布的水平α的双侧分位数.
-
注:今后分别记4。与42为标准正态分布的上侧分位数与双侧分位数,
-
由P(X>F~α~)=α,及其密度函数是偶函数得
μ~1-α~=-μ~α~
二、 x x x^2^分布
- 定义1:设X1,X2,...,Xn是取自总体N(0,1)的样本,称统计量
x x x^2^=X~1~^2^+X~2~^2^+...+X~n~^2^ (2.1)
服从自由度为n的 x x x^2^分布 ,记为 x x x^2^~ x x x^2^(n)
这里,自由度是指式(2.1)右端所包含的独立变量的个数
三、t分布
小样本一般是指n<30.t分布适用于当总体标准差未知时,用样本标准差代替总体标准差,由样本平均数推断总体平均数以及两个小样本之间差异的显著性检验等
- 定义2设X~ N(0,1),Y~ x x x^2^(n) ,且X与Y相互独立,则称
服从自由度为n的t分布 ,记为T~t(n).t(n)分布的概率密度为
(偶函数) - 由t(n)分布的概率密度为偶函数得
t~1-α~(n)=-t~α~(n)
四、F分布
主要用于方差分析、协方差分析和回归分析等.
-
定义3:设X~ x x x^2^(m),Y~ x x x^2^(n) ,且X与Y相互独立 ,则称
服从自由度为(m,n)的F分布 ,记为F~F(m,n).
-
F(m,n)分布的概率密度为
-
密度函数f(x) 的图形见图5-2-5.
-
F分布具有如下性质
(1)若X~ t(n),则X^2^~F(1,n)
(2)若F~F(m,n),则
1/F~F(n,m).
(3)F分布的分位数:
设F~F(n,m),对给定的实数α(0<α<1),称满足条件
的数F~α~(n,m)为F(n,m)分布的水平α上侧分位数 ,如图5-2-6所示.F分布的侧分位数可从附表6中查得
-
F~1-α~(n,m)=1/F~α~(m,n)
由P(X>F~α~)=α,证
-
性质
--------------------------------------------------------**-------------------------------------------------------------
- μ~1-α~=-μ~α~
- t~1-α~(n)=-t~α~(n)
- F~1-α~(n,m)=1/F~α~(m,n)
5.3抽样分布(第六章基础)
- 定理1设总体X~N(μ,o2),X1,X2,...,Xm是取自X的一个样本,¯X为该样本的样本均值,则有
-------------------------------------------------------***重要(2)-------------------------------------------------------
- 定理2设总体X~N(μ,σ2),X1,X2,...,Xn是取自X的一个样本,¯X与S^2^分别为该样本的样本均值与样本方差,则有
-------------------------------------------------------***重要(1)-------------------------------------------------------
(1) x x x^2^的自由度为n-1,因为X1-¯X+X2-¯X+...+Xn-¯X=0,则第n个变量可以由前n-1个求得,故只有n-1个独立变量,即自由度为n-1. - 定理3设总体X~N(μ,σ2),X1,X2,...,Xn是取自X的一个样本,¯X与S^2^分别为该样本的样本均值与样本方差,则有
-------------------------------------------------------***重要(2)-------------------------------------------------------
(1)Xi相互独立,则Xi的函数也相互独立
(2)t分布是标准正态分布/√(卡方分布/n)
由定理2(2)可以得独立
注:μ是总体均值,¯X是样本均值