2025深度学习发论文&模型涨点之------因果机器学习
传统机器学习方法多聚焦于关联关系的挖掘,对于变量之间深层次的因果关系却难以有效揭示。这种局限性在诸多复杂问题场景中逐渐凸显,促使学术界对能够突破这一瓶颈的新型方法展开深入探索,因果机器学习应运而生。
因果机器学习作为一门新兴且极具潜力的交叉学科,巧妙融合了因果推断理论与机器学习算法,致力于从海量数据中抽丝剥茧,精准辨识变量间的因果关联,进而为模型的解释性、可迁移性以及决策的科学性提供有力支撑。它不仅在经济学、社会学、医学等传统领域展现出强大的应用价值,更在人工智能的前沿发展中扮演着关键角色,推动着机器学习技术迈向更加智能、可靠的阶段。
我整理了一些 因果机器学习【**论文+代码】**合集,需要的同学公人人人号【AI创新工场】发525自取。
论文精选
论文1:
[Nature子刊] Causal machine learning for predicting treatment outcomes
用于预测治疗结果的因果机器学习
方法
因果机器学习(Causal ML):提出了一种新的机器学习方法,用于从数据中估计治疗效果,包括疗效和毒性,从而支持药物的评估和安全性。
因果图(Causal Graph):通过因果图表示变量之间的因果关系,为因果推断提供基础。
潜在结果框架(Potential Outcomes Framework):基于潜在结果框架,定义了不同的因果量(如平均处理效应ATE和条件平均处理效应CATE),并选择相应的因果ML方法进行估计。
模型选择与评估:讨论了如何选择合适的因果ML方法,并提出了评估因果ML方法的策略,包括使用随机变量进行验证和替换处理变量进行稳健性检查。

创新点
个性化治疗效果估计:能够估计个体化治疗效果,为临床决策提供更精准的支持,相比传统统计或ML方法,能够更好地处理高维和非结构化数据(如图像、文本和时间序列数据)。
处理异质性:有效估计患者间治疗效果的异质性,识别对治疗有效或无效的患者亚组,为精准医疗提供了更细致的视角。
数据驱动的因果推断:将因果推断与机器学习相结合,能够从实验数据(如随机对照试验)和观察数据(如临床登记和电子健康记录)中估计治疗效果,拓宽了因果推断的应用范围。
降低偏倚风险:通过明确因果结构假设和使用因果图,降低了因未观察到的混杂因素导致的偏倚风险,提高了治疗效果估计的可靠性。

论文2:
[Nature子刊] Improving the accuracy of medical diagnosis with causal machine learning
用因果机器学习提高医学诊断的准确性
方法
反事实推理(Counterfactual Inference):将诊断重新定义为反事实推理任务,通过计算疾病对症状的反事实概率来评估因果关系。
预期失效(Expected Disablement)和预期充分性(Expected Sufficiency):提出了两种新的诊断度量方法,用于量化疾病对症状的因果解释能力,满足一致性、因果性和简洁性三个基本要求。
贝叶斯网络(Bayesian Networks):使用贝叶斯网络作为疾病模型,结合因果推理,推导出反事实诊断算法。
结构因果模型(Structural Causal Models, SCMs):将贝叶斯网络扩展为结构因果模型,以支持反事实推理和因果分析。

创新点
诊断准确性提升:相比传统关联诊断算法,反事实诊断算法在临床案例测试中平均准确率提高了5.74%,达到77.26%,进入医生群体的前25%,达到了专家临床准确率。
罕见病诊断改进:在罕见病和极罕见病的诊断中,反事实算法的准确率分别提高了29.2%和32.9%,显著优于关联算法,减少了罕见病误诊的可能性。
后向兼容性:反事实算法可以在不改变现有疾病模型的情况下,直接应用于现有的贝叶斯诊断模型,作为现有系统的即时升级,具有很强的实用性。

论文3:
[NIPS] Causal Discovery in Semi-Stationary Time Series
半平稳时间序列中的因果发现
方法
半平稳时间序列因果模型(Semi-Stationary SCM):提出了一种新的因果模型,用于描述具有周期性因果机制的非平稳时间序列,能够捕捉因果机制的交替和重复变化。
PCMCIω算法:基于PCMCI算法,开发了一种新的约束基于的非参数算法PCMCIω,用于发现半平稳时间序列中的因果关系,并通过条件独立性(CI)测试识别底层因果图。
时间分区(Time Partition)和齐次时间分区(Homogenous Time Partition):定义了时间分区和齐次时间分区,用于处理具有周期性因果机制的时间序列数据,确保样本的一致性。
马尔可夫链(Markov Chain):利用马尔可夫链的性质,将时间序列数据转换为马尔可夫链,以便在假设条件下进行因果关系的推断。

创新点
周期性因果关系发现:首次提出了一种能够处理半平稳时间序列中周期性因果关系的方法,能够正确识别因果机制的周期性变化。
性能提升:在连续值和离散值时间序列的实验中,PCMCIω算法在因果图恢复任务上表现出色,特别是在处理具有较大周期性(ωmax)的时间序列时,其精度显著优于其他算法。
非平稳时间序列适用性:该算法不依赖于平稳性假设,能够处理实际应用中常见的非平稳时间序列数据,拓宽了因果发现方法的应用范围。
理论保证与实验验证:通过理论分析和广泛的实验验证,证明了PCMCIω算法在因果关系发现任务中的有效性,并在真实世界气候数据中发现了潜在的周期性因果关系。

论文4:
Inferring Heterogeneous Treatment Effects of Crashes on Highway Traffic: A Doubly Robust Causal Machine Learning Approach
推断交通事故对高速公路交通的异质性处理效应:一种双重稳健因果机器学习方法
方法
Neyman-Rubin 因果模型(RCM):用于从因果角度构建问题,定义交通事故对高速公路速度的因果效应。
条件Shapley值指数(CSVI):基于因果图理论,用于筛选不良变量,去除对因果推断无益的变量。
结构因果模型(SCM):定义统计估计量,明确因果效应的统计目标。
双重稳健学习(DRL):结合机器学习和因果推断,通过倾向得分匹配和回归模型估计异质性处理效应。
匹配算法:用于选择"反事实结果"以验证估计的因果效应,通过计算误差指标评估模型准确性。

创新点
异质性因果效应估计:首次在高分辨率数据环境中估计交通事故对交通速度的异质性因果效应,揭示不同事故类型在不同时间和空间下的影响。
CSVI变量选择方法:提出基于因果图的条件Shapley值指数,有效筛选不良变量,将误差指标MAE从10.74降低到9.17(针对追尾事故)。
双重稳健学习的应用:在交通领域首次应用DRL方法,相比其他因果推断方法(如GRF和DML),DRL在估计误差上表现更优,MAE降低至10.73。
高分辨率数据整合:将交通流量、事故记录和道路几何数据以5分钟间隔和1英里段落的方式整合,提供更精细的因果分析。
