目录
学习目的
SPSS第五讲 | 两独立样本均数T检验,你会了吗?
软件版本
IBM SPSS Statistics 26。
原始文档
P值是假设检验的终极者
你需要记住一句话"P值是假设检验的终极者,如果P<0.05, 就有显著性结果;如果P>0.05,就没有显著性结果"。
需要说明的是,女士品茶中的P值是比较容易计算,如果涉及到一些复杂事件,则需要使用正态分布等概率分布来计算P值。但无论如何,我们学习各种统计方法,正态检验、t检验、F检验、相关和回归等等,最终就是为了计算出P值的大小,再依据P值做出统计推断。
有了P值的简单粗暴作用,很多科研工作者的青春就献给了【P值】。
两独立样本均数T检验
两独立样本均数T检验,常用来比较两个不同样本所属的总体均数是否存有差异。在实验性研究中,常用来比较随机对照实验的干预效果检验;在观察性研究中,常用来比较不同群体的特征差异,比如,男生与女生的身高是否存有差异。
其假设检验如下(啥假设检验?请点击此处统计原理之④假设检验:从女士品茶说起)。
H0:μ1=μ2,即两样本的总体均值相等;
H1:μ1≠μ2,即两样本的总体均值不等。
α=0.05。
两独立样本均数T检验的原假设(H0)为两样本的总体均值相等,若p<0.05,则拒绝原假设H0,接受H1,认为两样本的总体均值在95%的置信水平下不相等,两样本之间的差异具有统计学意义或具有显著性差异。
一、实战案例
听了主任的话,小白随机抽测田径专业和足球专业的大侠100米(s)成绩,其中田径专业抽取22人,足球专业抽取23人,分析不同专业大侠们100米跑步成绩有无差异?
读取数据:
GET
FILE='E:\**********\小白爱上SPSS\小白数据\第五讲:两独立样本t 检验.sav'.
二、案例解析
该案例比之前单样本T检验多了一个样本,分成田径专业和足球专业两个独立样本。本研究之目的是比较田径专业和足球专业的大侠们的100米跑步成绩是否有差异。江湖中田径和足球专业的大侠们不仅只有45名,故需要依据这45名大侠的100米跑步成绩进行统计推断。
三、统计策略
统计分析策略口诀"目的引导设计,变量确定方法"。
针对上述案例,扪心七问。
Q1:本案例研究目的是什么?
A:比较差异。比较两个不同样本的总体均数是否存有差异
Q2:比较的组数是多少呢?
A:比较两组,且这两组相互独立。
Q3:本案例属于什么研究设计?
A:观察性研究
Q4:有几个变量?
A:专业和100米跑成绩两个变量。专业是分组变量,100m跑成绩是结局变量。
Q5:变量类型是什么?
A:一个是分组(分类)变量,分成田径和足球两组,另一个连续型变量,100米跑步成绩。
Q6:连续型变量服从正态分布么?
A:需要检验。若服从,采用两独立样本T检验;若不服从正态,采用秩和检验。
Q7:两样本总体成绩的方差是否齐性?
A:需要检验。如果不齐,要看T检验的矫正结果。
概括而言,如果数据满足以下条件,则采用两独立样本T检验。
四、SPSS操作
1、正态性检验
对田径和足球成绩进行正态性检验。
命令:
EXAMINE VARIABLES=x BY zb /*x为成绩,zb为分组依据*/
/PLOT BOXPLOT NPPLOT /*若无此行,则不输出正态性检验表*/
/COMPARE GROUPS
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
检验结果:
默认假设数据符合正态分布。经S-W检验,田径和足球专业的100m跑步成绩的P值分别为0.193和0.078,P值均大于0.05,无统计学意义(接受原假设),可认为两组数据符合正态分布。
2、T检验(独立样本T检验)结果
Step1:打开SPSS,依次点击"分析------比较均值------独立样本T检验"。
Step2:弹出独立样本T检验对话框。
Step3:在"独立样本t检验"窗口中,将"100m"变量选入"检验变量"栏中,"zb"变量选入"分组变量"栏中;点击"定义组",在"定义组"对话窗口,根据'田径'赋值为1,'足球'赋值为2,分别填入"1"和"2"。
Step4: 点击"继续"和"确定"就可得出两独立样本T检验结果。
命令行:
T-TEST GROUPS=zb(1 2)
/MISSING=ANALYSIS
/VARIABLES=x
/CRITERIA=CI(.95).
五、结果解读
T检验统计分析有两张表,一张为"组统计",另一张为"独立样本检验"。
第一张表为"组统计"分别提供两组数据的样本数(n)、平均值(mean)、标准差(SD)、标准误(Se)。
第二张表,则给于了t检验的的结果,该结果分为三个部分。
① 莱文方差等同性检验:Levene 方差齐性检验,上文已经提及t检验要符合方差齐性,那么方差到底是否齐性呢?假设数据符合方差齐。此处便是假设检验的结果,显著性即为p值,若p>0.05,无统计学意义(接受原假设),认为方差齐性,即p<0.05,可认为方差不齐。
② 平均值等同性t检验。此处是核心的假设检验结果。结果分为两行,分别"假定等方差"(方差齐)的t检验的结果,和"不假定等方差"(方差不齐)的检验结果,我们称之为t'检验(校正t检验,SPSS校正了自由度和t值)。
换句话说,若方差齐则采用t检验,看第一行t检验结果。若方差不齐,一般采用可以采用t'检验(SPSS校正自由度和t值),看第二行统计分析的结果。
原假设:田径专业和足球专业的大侠们的100米跑步成绩没有差异。
本题方差齐,因此t=-3.336,p=0.002,差异具有统计学意义(不接受原假设)。拒绝H0,接受H1。并结合第一张表,可知田径专项的跑步平均成绩(13.845±0.718s)要快于足球专项跑步成绩(14.574±0.745s)。
③此处t检验结果还给出了两组数据均数的差值、标准误和差值的95置信区间(95% CI)上下限。
Tips:补充知识
方差齐性检验有F检验、Bartlettχ2检验、Levene检验、残差图。F检验和Bartlett χ2检验要求数据资料具有正态性,而且F检验只能检验两个总体方差是否齐同,Levene检验所分析资料可不具正态性,结果更为稳健,它还可以检验多个总体的方差齐性,是最常用的检验方法。
六、规范报告
规范报告有多种方式,本公众号只提供一种方式供参考。
1、规范表格
表 田径和足球专业100米跑步成绩差异比较
2、规范文字
经S-W检验结果显示,数据服从正态分布,故采用两独立样本T检验。T检验结果显示,田径专业的跑步平均成绩为(13.85±0.72)要快于足球专业跑步成绩(14.57±0.75),t=-3.34, p=0.002,95%CI(-1.17~-0.290)。
注意
1、虽然有些论文没有报告t、p,只是用标识显著性,本公众号建议初学者应报告t、p值,以更深刻地理解其含义。
2、现在越来越多的文章需要提供差值的的95%CI, 所以建议今后统计分析时报告差值的95%CI。
3、两独立样本t检验之前,一定要进行正态性检验,并简要报告正态性检验结果。
4、虽然论文中一般不报告方差齐性检验结果,但一定要依据方差齐性结果选择t检验结果。
5、关于小数点,一般保留1-2位,p值除外。很多杂志要求不同的p值提供小位数不同,但P值一律保持3位是不会错的。若碰到 SPSS结果为0.000 的,书写成*<0.001***。
划重点
1、两独立样本t检验来比较两个不同样本的总体均数是否存有差异,可用于实验性和观察性研究。
2、两独立样本t检验的统计策略:分组变量分成独立两组,结局变量要求满足连续性、正态性和方差齐性。
3、两独立样本t检验之前,一定要进行正态性检验,并简要报告正态性检验结果。
4、虽然论文中一般不报告方差齐性的检验结果,但一定要依据方差齐性结果选择t检验方法。