数据分析为何要学统计学(10)——如何进行比率检验

比率检验是通过样本推测某种事件的总体占比水平。要求事件仅有互斥的两种情况,即,概率分别为p与1-p。

比率检验分单样本和双样本两种情况,以下我们分别介绍。

1. 单样本比率检验

形如这样的问题:"小学生近视比例日益提高,抽取500个小学生进行视力测试,310个小学生近视,是否可认为小学生的近视比例超过了六成?"

进行单样本比率检验可用两种方法二项检验和z检验

二项检验(Bernoulli检验):对应n<30或np或n(1-p)小于5的情况。函数为statsmodels.stats.proportion.binom_test(count, nobs, value=0.5, alternative='two-sided');

z检验:对二项检验条件以外的情况。函数为statsmodels.stats.proportion.proportions_ztest(count, nobs, value=0.5, alternative='two-sided')。

参数说明:count------事件数,nobs------样本容量,value------比率, alternative------检验方向,默认双侧,还可以为larger和smaller。

上例nobs=500,p=60%,np=300,n(1-p)=200,满足z检验方法的使用条件。根据题意,可以如下代码求解:

python 复制代码
from statsmodels.stats import proportion
proportion.proportions_ztest(310,500,0.6,alternative='larger')

结果为p=0.0.1784>0.05,还不能接受H1:"小学生的近视比例超过了六成"的假设。尽管在比例上已经是62%,超过6成,但这只是部分代表的比例,而不是总体水平下的比例。

2. 双样本比率检验

可使用上述检验的双样本函数test_proportions_2indep(count1, nobs1, count2, nobs2, value=None, alternative='two-sided'),也可以使用Fisher精确检验(n<40或有理论值<1或p值接近0.05)或卡方检验(其它情况)。详见卡方检验文章。

相关推荐
Simon_lca11 小时前
验厂不翻车!Acushnet 11 项核心政策 + 自查要点,一文搞定
大数据·人工智能·经验分享·算法·制造
2501_9481142411 小时前
2026 深度评测:Qwen 3.6-Plus 全模态逻辑链融合架构解析与高可用接入实践
人工智能·gpt·ai·架构·claude
水如烟11 小时前
孤能子视角:AI分形定律,结构依赖度 = AI能效比,以及科研“结构偏见“端倪
人工智能
一江寒逸11 小时前
人工智能的“记忆灵魂”:深度拆解大模型时代的上下文技术体系、实战与未来
人工智能
开放知识图谱11 小时前
论文浅尝 | 图形约束推理:基于大型语言模型在知识图谱上的可信推理(ICML2025)
人工智能·语言模型·自然语言处理·知识图谱
游了个戏11 小时前
微信小游戏 vs QQ小游戏:表面是兄弟,骨子里是两套完全不同的玩法
人工智能·游戏·微信
人工智能AI技术12 小时前
人工智能发展简史:关键节点与技术突破
人工智能
Mr数据杨12 小时前
共享单车需求预测与城市运营调度优化
机器学习·数据分析·kaggle
爱写代码的小朋友12 小时前
人工智能赋能下的基础教育课堂评价体系重构——从单一分数到核心素养的多维评估
人工智能·课堂教学
杜稀饭12 小时前
告别 HDR 调参玄学:AI 辅助 HDR 融合怎么落地
人工智能