统计学-R语言-7.4

文章目录


前言

本片是对非参数检验最后的介绍。


非参数检验

两个独立样本的Mann-Whitney检验

Mann -Whitney检验也称为Mann- Whitney U检验(Mann-Whitney U test)或称为 Wilcoxon秩和检验,它是由 Henry B.Mann和D.R. Whitney于1947年提出的。用于确定两个总体间是否存在差异的一种非参数检验方法,该检验是两个独立样本t检验(或者z检验)的一种替代方法(参数方法),但它不需要诸如总体服从正态分布且方差相等之类的假设,唯一的要求是两个独立随机样本的数据至少是顺序数据。

Mann -Whitney检验与Wilcoxon符号秩检验不同,它不基于相关样本,而是使用两个独立样本。

H0 :两个总体相同,H1 :两个总体不相同

或等价于

H0:Mx=My ;H1:Mx≠My

当Mann -Whitney检验拒绝H0时,可以得出两个总体不同的结论,但并不能证实它们究竟在哪些方面

是不同的,两个总体可能有不同的均值、不同的方差,或者不同的分布形式。

Mann -Whitney-检验也可以用于判断两个总体在中心位置上是否相同,也就是考察总体X的中位数

和总体Y的中位数 是否相等,因此也可提出如下形式的假设

H0:Mx=My ;H1:Mx≠My

H0:Mx=My ;H1:Mx≠My

如果H0为真,那么将m个x和n个y的数据混合在一起,并从小到大排列,这m+n=N个数据能够看作来

自相同总体的一个随机样本.若大部分的x大于y,或大部分的y大于x,则不能证明这n+m=N个数据来

自同一个总体,因此应拒绝H0

检验步骤

把两组数据混合在一起,得到m+n=N个数据,将N个数据从小到大排列,并找出N个数据的秩。

分别对样本(x1,x2,...,xm)和(y1,y2,...,yn)的秩求出平均秩,得到两个平均秩 和 ,并对平均秩的差距进行比较:若二者相差甚远,意味着一组样本的秩普遍偏小,另一组样本的秩普遍偏大,此时原假设有可能不成立,计算样本(x1,x2,...,xm)中每个秩大于样本(y1,y2,...,yn)的每个秩的个数 ,以及样本(y1,y2,...,yn)中每个秩大于样本(x1,x2,...,xm)中每个秩的个数,并对 进行比较,如果相差较大,此时原假设有可能不成立。

例题:

(数据: example6_6. RData)沿用例6-6。假定不知道两家企业生产的灯泡的使用寿命服从何种分布,检验两家企业生产的灯泡的使用寿命是否相同( =0.05)

解:将甲企业作为一个总体X,乙企业作为另一个总体Y,要检验两家企业生产的灯泡的使用寿命是否相同,就是检验两个总体的位置参数是否相等。因此提出如下假设:

H0:M甲=M乙;H1:M甲≠M乙

首先将两组数据混合在一起,得到20+20=40个数据,将40个数据从小到大排列,并找出它们的秩。然后计算检验统计量,并根据P值做出决策。检验的R代码和结果如下所示

函数wilcox.test(x,y,)中的x和y是两个样本。 paired=true表示进行配对检验,默认 paired=FALSE。

r 复制代码
load("C:/example/ch6/example6_6.RData")
attach(example6_6)
wilcox.test(甲企业,乙企业)

结论:在该项检验中,统计量W=319,P=0.009334,P<0.05,拒绝H0,有证据显示两家企业灯泡的使用寿命有显著差异。

注:函数wilcox.test(x,y,)中的x和y是两个样本。 paired=true表示进行配对检验,默认 paired=FALSE。

Wilcoxon符号秩检验是配对样本t检验(参数方法)的一种替代方法,该检验只要

求两个样本的数据之差服从对称分布。

检验两个总体的分布是否相同,或者说两个总体的中位数是否相同

设X,Y是两个连续的总体,且具有对称分布,两个总体分别随机抽取n个观察值,

组成n个数对(x1,y1),(x2,y2),...(xn,yn),每个数对的差记为di=xi-yi

若X,Y是具有相同分布的总体,则有P(di>0)=P(di<0),即xi>yi的概率与xi<yi

的概率相等,这也意味着差值di的中位数等于0。用Md表示差值di的中位数,如果关

心两个总体的分布是否相同,或者说两个总体的中位数是否相同,可以建立如下假

设: H0: Md=0 ;H1: Md≠0 (Md表示差值的中位数)

检验步骤

计算各数据对的差值di,并取绝对值,排序后求出秩,最小的|di|秩为1,最大的|di|秩为n。如果有相同的|di|则取各点秩的均值 。

计算检验统计量W或z:

对于正的di的秩和负的di的秩分别加总,得到正秩的总和 与负秩的总和 Wilcoxon符号秩检验的统计量是 中的较小者。对于双侧检验H0: Md=0 ;H1: Md≠0;在H0为真时 的大小应该近似相等,如果二者差异较大应怀疑H0,根据P值作出决策。

例题:

(数据: example6_7. RData)沿用例6-7。检验消费者对两种饮料的评分是否有显著差异( =0.05)

解:设消费者对新款饮料的评分为X,对旧款饮料的评分为Y

提出如下假设:

H0:X=Y;H1:X≠Y

r 复制代码
load("C:/example/ch6/example6_7.RData")
attach(example6_7)
wilcox.test(旧款饮料,新款饮料,paired=TRUE)

结论:在该项检验中,在该项检验中,V=5.5,P=0.04759,P<0.05,拒绝H0,有证据显示消费者对新旧饮料的评分有显著差异。


练习

1、(exercise6_9.RData)为了解一种节能灯的使用寿命,随机抽取了10只灯泡,测得其使用寿命(单位:小时)如exercise6_9.RData所示,采用 Wilcoxon符号秩检验检验该种节能灯使用寿命的中位数是否等于6000小时(α=0.05)。

设:M1代表该种节能灯使用寿命的中位数;M2 代表该种节能灯使用寿命的中位数为6000

H0:M1=M2 H1:M1 ≠M2

r 复制代码
 wilcox.test(exercise6_9$寿命,m=6000)

结论:在该项检验中,V=41,P=0.1934,P>0.05,不拒绝H0,故有证据表明该种节能灯使用寿命的中位数为6000小时。

2、(exercise6_10.RData)某种品牌的彩电在两个城市销售,在A城市和B城市各有8个商场销售。exercise6_10.RData记载了各商场一年的销售量(单位:台)。采用Mann- Whitney检验分析两个城市的销售量是否有显著差异(α=0.05)。

设:设:μ1为A城市一年销售量的中位数;μ2为A城市一年销售量的中位数

H0:μ1=μ2 H1:μ1 ≠μ2

r 复制代码
attach(exercise6_10)
wilcox.test(A城市,B城市)

结论:在该项检验中,V=26.5,P=0.5992,P>0.05,不拒绝H0,故有证据表明两个城市的销售量有显著差异。

3、(exercise6_11.RData)为分析股票的每股盈利状况,在某证券市场上随机抽取10只股票,得到上年度和本年度的每股盈利(单位:元)数据如exercise6_11.RData所示。采用 Wilcoxon符号秩检验分析:本年度与上年度相比,每股盈利是否有显著提高(α=0.05)。

设Md为上年度每股盈利的中位数与本年度每股盈利的中位数的差值。

H0:Md>=0 H1:Md < 0

r 复制代码
wilcox.test(exercise6_11$上年度,exercise6_11$本年度,alt="less",paired=T)

结论:在该项检验中,P= 0.04147,P<0.05,拒绝原假设,有证据表明,本年度与上年度相比,每股盈利有显著提高。

相关推荐
萧鼎42 分钟前
Python并发编程库:Asyncio的异步编程实战
开发语言·数据库·python·异步
学地理的小胖砸43 分钟前
【一些关于Python的信息和帮助】
开发语言·python
疯一样的码农44 分钟前
Python 继承、多态、封装、抽象
开发语言·python
^velpro^1 小时前
数据库连接池的创建
java·开发语言·数据库
秋の花1 小时前
【JAVA基础】Java集合基础
java·开发语言·windows
小松学前端1 小时前
第六章 7.0 LinkList
java·开发语言·网络
可峰科技1 小时前
斗破QT编程入门系列之二:认识Qt:编写一个HelloWorld程序(四星斗师)
开发语言·qt
全栈开发圈1 小时前
新书速览|Java网络爬虫精解与实践
java·开发语言·爬虫
面试鸭1 小时前
离谱!买个人信息买到网安公司头上???
java·开发语言·职场和发展
小白学大数据1 小时前
JavaScript重定向对网络爬虫的影响及处理
开发语言·javascript·数据库·爬虫