因果推断之中介效应

在AB实验和非AB实验因果推断中,我们得到的结论往往是单一的变量X对变量Y的影响,而我们往往想知道X是通过何种路径对Y造成影响的。此时就需要通过中介效应分析来得出因果关系之中的变量影响路径。在业务中,通过探索中介效应我们也可以更准确掌握不同变量间的直接和间接关系,从而对业务问题提供更深层次的见解。本文介绍了中介效应的基本概念和进行中介效应分析的方法以及相关案例。

1. 中介效应介绍

1.1 中介效应定义

根据温忠麟等(2004)学者的观点:

考虑自变量X对因变量Y的影响,如果X通过影响变量M来影响Y,则称M为中介变量。例如,父亲的社会经济地位影响儿子的教育程度,进而影响儿子的社会经济地位;又如,工作环境通过工作心情影响工作满意度;在这两个例子中,儿子的教育程度和工作感觉是中介变量M。

其中,中介效应属于间接效应(indirect effect)的一种。

在下图1中,c是X对Y的总效应(total effect),a×b是经过中介变量M的间接效应,c'是直接效应(direct effect)

图1 中介效应 资料来源:温忠麟等,2004

1.2 检验中介效应的意义

  1. 在两个存在因果关系 的变量之间,可以继续选取除其二外的其他变量 作为中介进行进一步研究。在检验中介效应的同时,探索因果关系实现的机制。
  1. 在实际研究中,当我们预期两个变量间应当存在因果关系,在检验结果中却发现因果关系并不显著时,除了二者之间确不存在因果关系外,还存在一种可能 --> 由于「存在两个竞争中介」导致因果效应相互抵消

对比货拉拉现状: 用AB实验探究变量X是否对结果Y有影响,但变量X为什么对结果Y有影响,则根据业务经验和直觉定性给出猜测,无定量衡量。

1.3 中介效应理论模型

图4 中介效应模型

  • 「简单中介」是指一个中介变量在自变量X对因变量Y的影响中起着中介作用;

  • 「平行中介」是指多个中介变量如M1,M2都在自变量X对因变量Y的影响中起着中介作用;平行中介模型是指中介变量之间互不影响的模型;

  • 「链式中介」是指多个中介变量如M1,M2都在自变量X对因变量Y的影响中起着中介作用;链式中介模型是指中介变量之间相互影响的模型。如上图有三组中介效应,分别为abc,dc,ae,其中abc为链式中介效应。

2. 中介变量选取

图5 中介变量选取

在选择中介变量时,需要依赖于理论指导和实践检验。以下为通常步骤:

以《Uber因果推断》中的案例为例,说明中介变量的选取过程

在研究「增加司机收入图」对「司机支持工单量」的影响时,想要探究:「司机收入图数量 究竟是如何对司机支持工单量造成影响的」,并进一步探索有没有其他可用的方式可以用于减少司机的支持工单数量。

  1. 提出问题:探究「自变量」司机收入图数量 ( 0->1 )对「因变量」支持工单数量的作用机制
  2. 理论指导:基于业务知识,从(除司机收入图数量、因支持工单数量以外的)所有变量中筛选出可能的中介变量;此处,在讨论范围内的可能中介变量有:司机对收入的理解、版面的美观程度、信息丰富程度等。
  3. 数据探索:验证所圈定的「可能中介变量」均有充足数据, 用以后续检验;此处所圈定的中介变量均可通过问卷收集充足的数据,为后续检验提供基础。

总的来说,「业务合理性」和 「数据充足性」是我们选取中介变量时需要考虑的两个首要因素。

3. 中介效应检验

3.1 因果逐步回归法 Baron and Kenny (1986 )

1. 检验原理

考虑一个简单的三变量非递归因果模型:自变量 X 通过中介变量 M 来影响因变量 Y。

「递归模型」:变量之间因果关系仅为单方向的结构方程模型,即两个变量中谁是因变量谁是自变量是确定的;

「非递归模型」:变量之间存在交互作用的结构方程模型,变量之间可能互为因果。

如图所示:

图6 中介效应基本框架

M 起到完全中介作用,需同时满足三个条件:

  1. 自变量 X 的变动应能够显著解释中介变量 M 的变动(路径 a 显著)
  2. 中介变量 M 的变动能够显著解释因变量 Y 的变动(路径 b 显著)
  3. 控制路径 a 和 b 后,X 与 Y 之间原本显著的关联将消失(路径 c 不显著)

为此采取线性回归估计如下三个方程:

2. 检验流程

图7 中介效应检验流程

此处:

「完全中介效应」指 X 影响 Y 时,全部通过中介变量 M 实现,即 X 能且只能通过 M 影响到 Y

「(部分)中介效应」指 X 影响 Y 时,一部分直接影响,一部分通过中介变量 M 去影响

3. B&K法的局限之处

尽管许多研究提出要检验中介效应,但仅在不到三分之一的研究包括了中介效应的显著性检验。而那些进行了正式测试的研究中,大多数使用的是Baron和Kenny的方法。

针对B&K逐步回归法存在的诸多问题,Zhao等(2010)总结出了一套更为合理有效的中介效应检验程序,并推荐按照P&H(2004)提出的Bootstrap法进行中介检验。

3.2 优化的中介效应检验:Zhao(2010)、Preacher&Hayes(2004)

1. 检验流程

Zhao(2010)中介效应检验和分析程序

在确定了 a × b 中介路径显著后,还需要进一步探讨该路径是否唯一,以及可能存在的其他中介路径与现有中间路径的关系是怎样的。

Zhao等(2010)提出了深入分析上述问题的检验办法。具体而言:

2. 参数检验方法

与B&K逐步回归中使用线性回归和Sobel检验不同,本方法在检验a × b 显著性时引入了Bootstrap法。

4. 中介效应的研究步骤

4.1 实例

以检验「社会融资规模」在「杠杆率影响经济发展」的过程中发挥的中介效应为例

第一步 提出问题 探究「自变量」杠杆率 ( 0->1 )对「因变量」经济发展的作用机制
第二步 理论指导 根据宏观经济学相关知识,此处圈定的可能中介变量仅有:社会融资规模
第三步 数据探索 社会融资规模数据在国泰安数据库国家统计局均可获取充足数据用以后续研究
第四步 实证检验 通过B&K法,证明中介效应的显著性
第五步 模型比较 此处仅考虑一个中介变量,故不涉及横向比较
第六步 现实意义 集合检验结果,对此处中介效应的实际意义做出了分析

杠杆率对经济增长的作用在很大程度上依赖于资本流动使用效益

社会融资」是让资金流通于各个市场、导致货币供给和需求发生变化,进而通过货币乘数、投资乘数最终对经济的发展产生一定影响的过程

采用因果逐步回归法进行中介效应检验

  • 建立个体固定效应模型
  • 参考检验流程,进行逐步回归
  • 回归结果如下

注:*、** **、** ***分别表示系数在 10% 、5% 和 1% 的置信水平上显著

  • 结合分析结果,得出结论

杠杆率对社会融资规模有显著的负向影响,上行的杠杆率加重了金融系统负担,导致资金使用效率下降。金融系统提供实体经济足够的资金供给,最终直接表现为社会融资规模的下滑。

与此同时,社会融资规模增速与名义GDP增速始终保持一致。也就是说,社会融资规模与实体经济密切相关,且起到正向作用。这是因为社会融资规模保证了实体经济发展的资金来源和经济支持。

当杠杆率上升时,社会融资规模随之下降,进而为经济增长带来了不利影响。社会融资规模作为中介变量,成功地将省际杠杆率这一金融领域的指标与gdp增长值这一实体经济领域的指标结合起来,沟通并解释了杠杆率影响经济增长的机制。

5. 总结

本文介绍了中介效应的概念和其具体操作,并用实例演示了如何进行中介效应分析和解读,为变量间的因果关系提供更深入的洞见。

相关推荐
林叔聊渠道分销10 分钟前
从0到1构建渠道运营体系:实战案例与策略指南
大数据·运维·人工智能·产品运营·流量运营·渠道运营
ToBeWhatYouWannaBe.14 分钟前
代码随想录-Day49
java·数据结构·算法·leetcode
Little Tian19 分钟前
插入排序——C语言
c语言·数据结构·算法·排序算法
creative_mind29 分钟前
My Greedy Algorithm(贪心算法)之路(一)
c++·算法·贪心算法
逆风就重开36 分钟前
大数据中的常见数据问题:独断脏
大数据·数据仓库·数据分析
阳光男孩011 小时前
力扣1546.和为目标值且不重叠的非空子数组的最大数目
数据结构·算法·leetcode
我非夏日1 小时前
基于Hadoop平台的电信客服数据的处理与分析④项目实现:任务18: 数据展示
大数据·hadoop·分布式·大数据技术开发
武子康1 小时前
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
java·大数据·hive·hadoop·分布式·hdfs·mariadb
一座野山1 小时前
hadoop分布式中某个 节点报错的解决案例
大数据·hadoop·分布式
华子w9089258591 小时前
基于大数据技术Hadoop的气象分析可视化大屏设计和实现
大数据·论文阅读·hadoop·分布式