R语言实现中介分析(1)

中介分析,也称为介导分析,是统计学中的一种方法,它用于评估一个或多个中介变量(也称为中间变量)在自变量和因变量之间关系中所起的作用。换句话说,中介分析用于探索自变量如何通过中介变量影响因变量的机制。

虽然中介效应的存在可能意味着某种因果关系机制,但它并不能直接证明因果关系。因此,在解释中介分析结果时,需要考虑其他可能的解释和变量之间的关系。

复制代码
#Mediatoion analysis
#install.packages("mediation")
help(package="mediation")
library(mediation)
data(jobs)
#线性结果和中介模型
b <- lm(job_seek ~ treat + econ_hard + sex + age, data=jobs)#这个模型用treat(治疗或干预变量)、econ_hard(经济困难)、sex(性别)和age(年龄)来预测job_seek(求职)。
c <- lm(depress2 ~ treat + job_seek + econ_hard + sex + age, data=jobs)#这个模型用相同的变量treat、econ_hard、sex和age,以及job_seek(现在作为中介变量)来预测depress2(抑郁程度)。
# Estimation via quasi-Bayesian approximation
contcont <- mediate(b, c, sims=50, treat="treat", mediator="job_seek")#这个模型用相同的变量treat、econ_hard、sex和age,以及job_seek(现在作为中介变量)来预测depress2(抑郁程度)。
summary(contcont)#查看中介分析的结果摘要。这个摘要通常包括中介效应的估计值、标准误、置信区间,以及直接效应和间接效应(通过中介变量的效应)的估计。
plot(contcont)#绘制中介分析的结果图
#ACME (Average Causal Mediation Effect): 这是中介变量(在这里是job_seek)的平均因果中介效应,表示处理变量(treat)通过中介变量对结果变量(depress2)的间接影响。
#ADE (Average Direct Effect): 这是处理变量对结果变量的直接效应,即在控制中介变量后的效应。
#Total Effect: 这是处理变量对结果变量的总效应,即直接效应和间接效应之和。

这个因果中介分析的结果提供了关于中介变量效应的一些重要估计和置信区间。以下是对结果的解读:

ACME (Average Causal Mediation Effect) :

估计值(Estimate)为 -0.0167,这意味着中介变量(可能是求职行为job_seek)平均而言在处理变量(treat)和结果变量(抑郁程度depress2)之间产生了负的间接效应。换句话说,处理通过中介变量减少了抑郁程度,但这一效应相对较小。

95%置信区间(95% CI Lower 和 95% CI Upper)为 [-0.0360, 0.00],这意味着我们不能排除ACME为零的可能性,因为零包含在这个区间内。

p-值为0.20,说明ACME的估计值在统计上并不显著,即我们不能有充足的证据认为中介变量产生了显著的间接效应。

ADE (Average Direct Effect) :

估计值为 -0.0424,表示处理变量对结果变量的直接效应(即控制中介变量后的效应)是负的,但同样相对较小。

95%置信区间为 [-0.1042, 0.03],这个区间包括零,因此直接效应在统计上并不显著。

p-值为0.40,进一步支持了直接效应不显著的观点。

Total Effect :

估计值为 -0.0591,表示处理变量对结果变量的总效应是负的。

95%置信区间为 [-0.1294, 0.02],这个区间也包括零,因此总效应在统计上并不显著。

p-值为0.20,与ACME的p-值相同,进一步表明我们没有足够的证据认为总效应是显著的。

Prop. Mediated (Proportion Mediated) :

这是中介效应占总效应的比例。估计值为 0.2152,意味着中介变量解释了约21.52%的总效应。但由于置信区间为 [-0.7867, 1.86],这个比例非常不确定,且包括负数,因此我们不能得出关于中介效应比例的具体结论。

p-值为0.24,表明这个比例在统计上并不显著。

Sample Size Used :

分析使用的样本大小为899,这是一个相对较大的样本,通常可以提供较为稳定的估计,但在这里由于效应本身可能较小或不存在,因此即使样本量相对较大,我们仍然不能得出显著的结论。

Simulations :

分析过程中使用了50次模拟来估计标准误和置信区间。模拟次数是一个相对较小的数字,但根据具体情境和计算资源,这可能是一个合理的选择。增加模拟次数可能会提供更准确的估计,但也会增加计算时间。

综上所述,这个因果中介分析的结果并没有提供足够的证据来支持中介变量(job_seek)在处理变量(treat)和结果变量(depress2)之间产生了显著的间接效应。同时,直接效应和总效应也都不显著。因此,我们不能基于这些结果得出关于中介效应存在或重要性的明确结论。

相关推荐
Davina_yu6 小时前
R语言报错:无法打开文件‘sales_2025.txt‘: No such file or directory
开发语言·r语言
小小8程序员7 小时前
R 语言 4.5.0 全解析:性能优化、新特性与使用指南下载安装步骤
r语言
墨&白.1 天前
如何卸载/更新Mac上的R版本
开发语言·macos·r语言
Lun3866buzha2 天前
【深度学习】Mask R-CNN在温室番茄成熟度检测中的应用——基于ResNet18与FPN的多级特征融合分类系统
深度学习·r语言·cnn
Katecat996633 天前
夜间收费站与道路场景多类型车辆检测与分类:基于Faster R-CNN R50 PAFPN的实现_1
分类·r语言·cnn
Piar1231sdafa3 天前
红枣目标检测Cascade R-CNN改进版_FPN结构优化详解
目标检测·r语言·cnn
天桥下的卖艺者3 天前
R语言绘制复杂加权数据(nhanes数据)多模型生存分析决策曲线
开发语言·r语言
Tiger Z3 天前
《R for Data Science (2e)》免费中文翻译 (第15章) --- Regular expression(1)
数据分析·r语言·数据科学·免费书籍
Dekesas96954 天前
【深度学习】基于Faster R-CNN的黄瓜幼苗智能识别与定位系统,农业AI新突破
人工智能·深度学习·r语言
青啊青斯4 天前
二、PaddlePaddle seal_recognition印章内容提取
人工智能·r语言·paddlepaddle