python统计分析——单样本t检验

参考资料:用python动手学统计学

1、导入库

python 复制代码
## 导入库
# 用于数值计算的库
import numpy as np
import pandas as pd
import scipy as sp
from scipy import stats
# 用于绘图的库
from matplotlib import pyplot as plt
import seaborn as sns
sns.set()

2、准备基础数据

python 复制代码
data=np.array([58.5298199 , 52.35303878, 74.4461695 , 52.98326296, 55.87687873,
        67.65984894, 47.72614076, 50.26690674, 56.50082581, 52.36104034,
        45.4578831 , 53.36098792, 52.12936842, 59.82777282, 41.68169176,
        49.3985677 , 64.21112808, 69.85864806, 42.91056354, 60.15878009])

3、提出假设

零假设:data的均值为50

备择假设:data的均值不是50

4、计算t统计量

python 复制代码
# 计算样本均值
mu=np.mean(data)
# 计算样本自由度
df=len(data)-1
# 计算平均数标准误
sigma=np.std(data,ddof=1)
se=sigma/np.sqrt(len(data))
# 计算t值
t_value=(mu-50)/se
print(t_value)

5、计算p值

假设总体服从正态分布,那么t值就服从t分布,所以可以使用t分布的累计分布函数。

双尾检验:p=(1-α)×2,这里的α不是显著性水平,而是用累计分布函数求出的当总体均值等于50(本例是50,在实际应用中看零假设对应的值)时的累计概率值,此值越大越好。

python 复制代码
alpha=stats.t.cdf(t_value,df=df)
p=(1-alpha)*2
print(p)

6、单样本t检验函数介绍

使用scipy.stats.ttest_1samp()函数可以方便进行t检验。

python 复制代码
stats.ttest_1samp(data,50)

常用参数介绍如下:

(1)a,数据源,相当于本例的data

(2)popmean,就是假设检验的总体均值,效果如下:

(3)nan_policy,当数据中存在空值nan时的处理方式。propagate表示nan参与计算;omit表示忽略nan;raise表示报错。

(4)alternative用于设置双尾检验/单尾检验。默认为双尾检验。可选设置有:'two-sided', 'less', 'greater'。

'two-sided'表示备择假设为样本均值与给定总体均值不同;

'less'表示备择假设为样本均值小于给定总体均值;

'greater'表示备择假设为样本均值大于给定总体均值。

注意观察下面p值的变化:

相关推荐
幸福的达哥13 分钟前
Python多线程、多进程、协程、锁、同步、异步的详解和应用
开发语言·python
m0_7066532324 分钟前
Python生成器(Generator)与Yield关键字:惰性求值之美
jvm·数据库·python
熬夜敲代码的小N25 分钟前
Python基础入门:环境配置全指南+核心语法解析
开发语言·python
嫂子开门我是_我哥26 分钟前
第十八节:项目实战2:简易通讯录(面向对象+文件持久化实现)
开发语言·python
乙酸氧铍30 分钟前
手机使用 ZeroTermux 调用 python 编辑缩放图像
图像处理·python·智能手机·安卓·termux
逄逄不是胖胖37 分钟前
《动手学深度学习》-52文本预处理实现
人工智能·pytorch·python·深度学习
MediaTea39 分钟前
Python:_sentinel 命名约定
开发语言·python·sentinel
Pyeako40 分钟前
opencv计算机视觉--图形透视(投影)变换&图形拼接
人工智能·python·opencv·计算机视觉·图片拼接·投影变换·图形透视变换
开发者小天1 小时前
python返回随机数
开发语言·python
嫂子开门我是_我哥1 小时前
第十五节:文件操作与数据持久化:让程序拥有“记忆”
开发语言·python