2025深度学习发论文&模型涨点之------因果机器学习
因果推断与机器学习的结合是一种跨学科的研究方法,旨在通过融合因果推断的理论框架和机器学习的强大数据分析能力,揭示变量之间的因果关系,并从复杂数据中提取有价值的因果信息。因果推断专注于识别和量化变量之间的因果效应,而机器学习则擅长处理大规模、高维数据,并从中发现复杂的模式和关系。两者的结合不仅能够提高因果效应估计的准确性,还能在数据驱动的决策过程中提供更可靠的依据。
我整理了一些因果机器学习【**论文+代码】**合集,需要的同学公人人人号【AI创新工场】自取。
论文精选
论文1:
Nature子刊\] Improving the accuracy of medical diagnosis with causal machine learning 利用因果机器学习提高医学诊断的准确性 **方法** 反事实推断:将医学诊断重新定义为一个反事实推断任务,通过计算疾病对症状的因果影响来提高诊断准确性。 因果诊断算法:提出"预期失效"(Expected Disablement)和"预期充分性"(Expected Sufficiency)两种反事实诊断度量方法,用于替代传统的基于关联性的诊断方法。 贝叶斯网络:使用贝叶斯网络作为疾病模型,结合因果推断框架,量化疾病与症状之间的因果关系。 临床案例测试:通过1671个临床案例测试验证算法的有效性,与44名医生的诊断结果进行对比。  **创新点** 因果推断的应用:首次将因果推断引入医学诊断领域,解决了传统关联性诊断方法的局限性。与传统关联性算法相比,因果诊断算法在诊断准确性上提升了约6.74%(从72.52%提升到77.26%),特别是在罕见病诊断中表现出色,对罕见病和非常罕见病的诊断准确率分别提高了29.2%和32.9%。 反事实诊断度量:提出的"预期失效"和"预期充分性"两种度量方法,能够更准确地识别导致症状的疾病,显著提升了诊断的准确性和可靠性。 模型的通用性:该算法可以直接应用于现有的贝叶斯诊断模型,无需对疾病模型进行重新训练,具有很强的通用性和可扩展性。  **论文2:** \[Nature子刊\] Causal machine learning for predicting treatment outcomes 因果机器学习用于预测治疗结果 **方法** 因果推断框架:提出了一种基于潜在结果框架的因果推断方法,用于估计个体化治疗效果。 异质性治疗效应(CATE)估计:开发了多种因果ML方法,包括元学习器和模型特定方法,用于估计异质性治疗效应。 不确定性量化:引入了贝叶斯方法和共形预测等技术,为治疗效果估计提供了不确定性量化。 临床数据应用:结合临床试验数据和真实世界数据(如电子健康记录)生成临床证据,支持临床决策。  **创新点** 个体化治疗效果估计:能够估计个体化治疗效果,为临床决策提供更精细的支持。与传统统计方法相比,因果ML在处理高维数据和复杂疾病动态方面具有显著优势。 不确定性量化:提供了治疗效果估计的不确定性量化,这对于临床决策中的风险评估至关重要。例如,因果森林方法能够提供严格的不确定性估计,显著提高了决策的可靠性。 临床应用的可行性:通过在多个临床案例中的验证,证明了因果ML方法在真实世界数据中的有效性和可行性,特别是在处理罕见疾病和长期结果方面。  **论文3:** B-Learner: Quasi-Oracle Bounds on Heterogeneous Causal Effects Under Hidden Confounding B-Learner:在隐藏混杂因素下对异质性因果效应的准最优界限估计 **方法** 元学习器设计:提出了一种名为B-Learner的元学习器,用于在存在隐藏混杂因素的情况下估计条件平均处理效应(CATE)的上下界。 Neyman正交估计方程:利用Neyman正交估计方程,结合伪结果回归,提高估计的稳健性和效率。 对比学习策略:通过对比学习策略,将视觉特征转换为更接近文本域的特征,以促进模态对齐。 模型不可知性:B-Learner可以使用任何函数估计器,如随机森林和深度神经网络,具有很强的灵活性。  **创新点** 尖锐界限估计:B-Learner能够提供尖锐的CATE上下界估计,显著提高了估计的精度。在合成数据实验中,B-Learner的均方误差(MSE)与Oracle估计器相当,表明其在估计精度上达到了准最优水平。 稳健性提升:通过Neyman正交估计方程,B-Learner对估计器的偏差具有更高的容忍度,显著提高了算法的稳健性。 灵活性和通用性:B-Learner支持多种估计器的组合使用,包括随机森林和神经网络,使其能够适应不同的数据类型和应用场景。 