大家好,孟德尔随机化大火,但是什么是孟德尔随机化,具体怎么实操呢
这没有其他教程的繁冗,我这篇讲最基础的孟德尔随机化的核心步骤,这个理解之后,再去考虑混杂因素等等术语。
孟德尔随机化(MR),其实是研究两个变量之间的因果关系。也就是研究谁决定了谁,是因果关系,而不是相关关系。
我画了一张图,协助理解:
现在再来读这句话是不是就理解MR了:孟德尔随机化(Mendelian Randomization, MR)是流行病学研究中评估病因推断的数据分析技巧,它是利用与暴露因素具有强相关的遗传变异作为工具变量,来评估暴露因素与结局之间的因果关系。
现在对三大假设是不是理解更深些了:
孟德尔随机化三大假设:
①关联性假设: SNP与暴露因素之间是强相关的。
②独立性假设: SNP与混杂因素之间是独立的。(本文暂没提到这一点)
③排他性假设: SNP只能通过暴露因素对结局产生作用。
现在再来详细介绍MR,会不会好理解些:
1 MR 背景与目的
1.1目的是明确因果关系
在关联分析中我们时常面对的一个问题便是 我们很难确定一个变量是否是真正的因果变量,而非有其他未观测的因素同时影响这个变量与结果,造成这个变量与结果相关联。在循证医学中,或是制定干预策略时,明确因果性是十分必要的。
这个问题实际上与内生性 endogeneity 相关,包括:反向因果关系 reverse causation, 忽略的混淆变量造成的偏倚 omitted variable bias due to confounding, 测量误差measurement error, 以及双向因果关系bidirectional causality等等问题。(这里的内生性在统计学上是指在回归分析中,解释变量(x)与误差项相关。)
1.2. RCT是金标准,但缺点明显
一般来说,明确因果关系的金标准时随机对照试验 RCT randomized control trial (RCT), 即对受试者随机分为对照组和实验组,以研究某个因素的影响。但现实中,要完成随机对照试验的难度非常高,需要大量的人力物力,有时因为伦理问题,对某个因素的研究几乎是不可能的。这时我们就要借助其他方法,而孟德尔随机化就是其中之一。
1.3. 孟德尔随机化与RCT的相似性
孟德尔随机化(MR,Mendelian randomization)便是为了解决以上问题而开发的方法,MR与RCT直接相关,两者有很高的相似性,如下图所示。
孟德尔随机化的核心其实是利用了孟德尔第二定律,也就是自由组合规律(law of independent assortment),当具有两对(或更多对)相对性状的亲本进行杂交,在子一代产生配子时,在等位基因分离的同时,非同源染色体上的基因表现为自由组合,这一过程类似于随机对照试验中的随机分组,所以我个人理解的孟德尔随机化就是 基于孟德尔第二定律的随机对照试验。
为什么MR可以探究因果关系呢,大家可以看下这篇文章的介绍部分,有助于理解MR
欢迎评论