现况调查定性资料样本量如何计算?R语言、PASS复现

Nhanes数据库数据挖掘,快速发表发文的利器,你来试试吧!欢迎报名郑老师团队统计课程,4.20直播。

在目前医学临床研究设计中,常常会有人在问该怎么计算定性资料横断面研究的样本量?究竟该怎样去计算才能又快又准确呢?

在进行研究设计时,我们就需要确定这项研究所需的样本量。而什么是样本量呢?样本含量就是在保证科研结论具有一定可靠性条件下,确定的最少观察例数。那么,样本量该如何计算呢?

1.首先,需要确定开展什么类型研究;

2.确定研究主要结局指标及其类型;

3.找公式;

4.填参数;

5.计算结果。

接下来,我们来跟着一篇文献分别采用公式计算、R语言、PASS来感受一下定性资料横断面研究的样本量计算过程:

这是一篇发表在BMJ open上的文章,题目为"Seroepidemiology of hepatitis A and B in the general population in Hong Kong: protocol of a cross-sectional survey using spatial sampling in a highly urbanised city"。

|----------------------------------|
| 原文PDF获取方式: 本公众号回复关键词**"原文"** |

1.首先确定这篇文章研究类型属于横断面研究

2.研究主要结局指标是甲型和乙型肝炎的人群血清阳性率,属于定性资料

3.定性资料横断面研究的样本量计算公式为:

4.填参数:

**Ⅰ类错误α:**根据α算出Zα,文章确定显著性水平为95%,因此α为0.05;

**容许误差δ:**文章控制为0.025;

**发生率P:**文章参考了香港最新研究的结果,甲肝和乙肝的血清阳性率分别为68.5%和8.9%。

5.根据公式计算结果: 文章通过公式分别按照甲肝和乙肝的血清阳性率计算的样本量分别为1326.3和498.4,最终选取两者中最大的取整样本量1327作为研究所需的最小样本量。

6.使用R 语言epiR包 的epi.sssimpleestb函数进行计算,将参数Py、epsilon、conf.level分别设置为文章对应的发生率P、容许误差δ以及95%置信水平

运行代码得到的结果也是1327

7.使用PASS软件进行计算,首先在选择界面的导航窗口中,依次单击Proportions → One Proportion →Confidence Interval,在显示窗口中单击Confidence Intervals for One Proportion,打开操作界面

在操作界面的设置区域中,Confidence Interval Width(Two-Sided)是指置信区间的宽度,即置信区间的下限到上限的值,而容许误差是置信区间一半的宽度。本研究的容许误差为0.025,则置信区间的宽度为0.05(即2倍的容许误差);

分别将Confidence Level(1-Alpha)、Confidence Interval Width(Two-Sided)、 P(Proportion) 参数设置为文章对应的0.95、0.05和0.685;

在Confidence Interval Formula中选择Simple Asymptotie,单击运行键Calculate;

结果显示,样本量也是1327人。

本公众提供各种科研服务了!

|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 一、课程培训 2022年以来,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班,包括R语言**、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、nhanes、孟德尔随机化等10余门课**。如果您有需求,不妨点击查看: 发文后退款:2024-2025年科研统计课程介绍 二、数据分析服务 浙江中医药大学郑老师团队接单各项医学研究数据分析的服务,提供高质量统计分析报告。有兴趣了解一下详情: 课题、论文、毕业数据分析 临床试验设计与分析公共数据库挖掘与统计 |

相关推荐
比昨天多敲两行5 分钟前
linux 线程概念与控制
java·开发语言·jvm
huaweichenai15 分钟前
php 根据每个类型的抽签范围实现抽签功能
开发语言·php
codeejun2 小时前
每日一Go-73、云原生成本优化 —— 资源限制 & 指标驱动扩容
开发语言·云原生·golang
就叫_这个吧2 小时前
Java注解、元注解、自定义注解定义及应用
java·开发语言·注解
Sam_Deep_Thinking2 小时前
聊聊Java中的of
java·开发语言·架构
小小de风呀5 小时前
de风——【从零开始学C++】(十一):list的基本使用和模拟实现
开发语言·c++·list
三行数学5 小时前
Matlab之父克利夫·莫勒尔逝世
开发语言·matlab
陌路205 小时前
C++高级进阶--夯实进阶基础(1)
开发语言·c++
梦想三三6 小时前
【PYthon词频统计与文本向量化】苏宁易购评论分析实战
开发语言·python
AI人工智能+电脑小能手6 小时前
【大白话说Java面试题 第93题】【Mysql篇】第23题:从查找速度来看,聚集索引和非聚集索引哪个更快?
java·开发语言·数据库·mysql·面试