数据分析为何要学统计学(10)——如何进行比率检验

比率检验是通过样本推测某种事件的总体占比水平。要求事件仅有互斥的两种情况,即,概率分别为p与1-p。

比率检验分单样本和双样本两种情况,以下我们分别介绍。

1. 单样本比率检验

形如这样的问题:"小学生近视比例日益提高,抽取500个小学生进行视力测试,310个小学生近视,是否可认为小学生的近视比例超过了六成?"

进行单样本比率检验可用两种方法二项检验和z检验

二项检验(Bernoulli检验):对应n<30或np或n(1-p)小于5的情况。函数为statsmodels.stats.proportion.binom_test(count, nobs, value=0.5, alternative='two-sided');

z检验:对二项检验条件以外的情况。函数为statsmodels.stats.proportion.proportions_ztest(count, nobs, value=0.5, alternative='two-sided')。

参数说明:count------事件数,nobs------样本容量,value------比率, alternative------检验方向,默认双侧,还可以为larger和smaller。

上例nobs=500,p=60%,np=300,n(1-p)=200,满足z检验方法的使用条件。根据题意,可以如下代码求解:

python 复制代码
from statsmodels.stats import proportion
proportion.proportions_ztest(310,500,0.6,alternative='larger')

结果为p=0.0.1784>0.05,还不能接受H1:"小学生的近视比例超过了六成"的假设。尽管在比例上已经是62%,超过6成,但这只是部分代表的比例,而不是总体水平下的比例。

2. 双样本比率检验

可使用上述检验的双样本函数test_proportions_2indep(count1, nobs1, count2, nobs2, value=None, alternative='two-sided'),也可以使用Fisher精确检验(n<40或有理论值<1或p值接近0.05)或卡方检验(其它情况)。详见卡方检验文章。

相关推荐
速融云1 小时前
汽车制造行业案例 | 发动机在制造品管理全解析(附解决方案模板)
大数据·人工智能·自动化·汽车·制造
金融OG1 小时前
99.11 金融难点通俗解释:净资产收益率(ROE)VS投资资本回报率(ROIC)VS总资产收益率(ROA)
大数据·python·算法·机器学习·金融
AI明说1 小时前
什么是稀疏 MoE?Doubao-1.5-pro 如何以少胜多?
人工智能·大模型·moe·豆包
XianxinMao1 小时前
重构开源LLM分类:从二分到三分的转变
人工智能·语言模型·开源
Elastic 中国社区官方博客2 小时前
使用 Elasticsearch 导航检索增强生成图表
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
云天徽上2 小时前
【数据可视化】全国星巴克门店可视化
人工智能·机器学习·信息可视化·数据挖掘·数据分析
大嘴吧Lucy2 小时前
大模型 | AI驱动的数据分析:利用自然语言实现数据查询到可视化呈现
人工智能·信息可视化·数据分析
艾思科蓝 AiScholar3 小时前
【连续多届EI稳定收录&出版级别高&高录用快检索】第五届机械设计与仿真国际学术会议(MDS 2025)
人工智能·数学建模·自然语言处理·系统架构·机器人·软件工程·拓扑学
watersink3 小时前
面试题库笔记
大数据·人工智能·机器学习
Yuleave4 小时前
PaSa:基于大语言模型的综合学术论文搜索智能体
人工智能·语言模型·自然语言处理