【科研快讯】当数学遇见AI:西安交大Nature Communications双响,AI for Science知识发现再添利器

论文一

  • 论文中文标题:基于距离几何的生成流模型预测化学反应过渡态
  • 论文英文标题:Generative Flow Model on Distance Geometry for Predicting Transition States of Chemical Reactions
  • 所在期刊/会议:Nature Communications
  • 发表日期:2026年6月
  • DOI:暂未提供(在线发表)

论文二

  • 论文中文标题:通过神经引导Lambda演算发现复杂系统中的多尺度深度公式
  • 论文英文标题:Discovering Multiscale Deep Formulas in Complex Systems via Neural-Guided Lambda Calculus
  • 所在期刊/会议:Nature Communications
  • 发表日期:2026年6月
  • DOI:暂未提供(在线发表)

2026年6月,西安交通大学数学与统计学院在人工智能赋能科学研究(AI for Science)领域迎来重要突破。孙剑教授团队与杨树森教授团队分别提出化学反应过渡态预测几何生成模型TS-DFM与多尺度复杂系统数学公式发现方法Deflex,两项成果同期发表于国际顶级综合性期刊《自然·通讯》(Nature Communications)。这两项研究以数学与人工智能深度交叉为基础,为科学知识发现提供了全新的工具与方法,标志着AI for Science从数据驱动预测向可解释规律发现的关键跃迁。

人工智能驱动的科学研究(AI for Science)正在深刻重塑科学发现的范式。近年来,以AlphaFold为代表的蛋白质结构预测模型的成功,展示了深度学习在科学领域的巨大潜力。然而,科学知识发现的更高追求不仅是"预测"未知,更在于从复杂观测数据中提取简洁、可解释的数学规律,进而揭示自然现象背后的本质机制。

化学反应过渡态作为连接反应物与产物的关键中间态,其结构的精确获取是理解反应机理、预测反应路径的核心难题。传统上,过渡态的获取依赖量子化学计算或迭代搜索方法,这些方法计算成本高昂,且对初始结构敏感、收敛困难。同时,从复杂系统数据中自动发现数学公式的任务同样面临挑战------现有符号回归方法在处理多变量、跨尺度、高阶结构时能力有限。

在这一背景下,西安交通大学数学与统计学院孙剑教授团队与杨树森教授团队分别从几何深度学习与神经符号学习两个方向切入,为上述难题提供了创新性解决方案。两项成果的同期发表,不仅体现了数学方法在AI for Science研究中的核心支撑作用,更展示了中国学者在智能科学研究前沿的持续突破。


TS-DFM:几何深度学习赋能过渡态预测

过渡态理论是化学动力学的基石。精确预测过渡态的结构与能量,对于理解反应机理、设计催化剂、开发新反应路径至关重要。然而,过渡态作为高能不稳定状态,难以通过实验直接观测;传统量子化学计算则面临计算量随体系规模呈指数增长的问题。

孙剑教授团队提出的TS-DFM(Transition State prediction via Distance Geometry and Flow Model)框架,创造性地将几何深度学习与最优传输理论相结合。与直接预测原子三维坐标不同,TS-DFM通过学习反应过程中原子间距离矩阵的演化规律,利用最优传输引导的几何流模型建模化学键结构的动态变化。这种方法使模型的生成过程天然符合化学反应的几何约束与物理规律。

该框架的核心创新在于将化学反应的几何约束嵌入生成模型的训练过程。模型不仅学习原子位置的分布,更学习化学键断裂与形成的距离演化规律,从而生成符合化学合理性(chemically plausible)的过渡态结构。

Deflex:神经引导符号学习发现多尺度数学规律

如何从复杂系统的高维数据中自动发现简洁、可解释的数学公式?这是符号回归(Symbolic Regression)领域的核心问题。杨树森教授团队提出的Deflex方法,将深度学习的表示能力与符号学习的形式化表达能力有机融合,开辟了多尺度复杂系统公式发现的新路径。

Deflex由两个核心子系统构成:Deflexformer与Deflexpressor。Deflexformer基于能量模型(Energy-Based Model)和自注意力网络,统一表征多种形式的物理规律,捕捉变量间的复杂非线性关系;Deflexpressor则引入Lambda演算增强的符号回归引擎,使系统能够表达和搜索包含高阶映射、求和、规约等复杂结构的数学公式。

这一设计的关键突破在于:传统符号回归方法通常只能发现单层结构的简单公式,而Deflex通过Lambda演算的引入,首次实现了对包含嵌套函数、求和项等高阶数学结构的有效搜索,从而能够发现Navier-Stokes方程、Langevin动力学等包含复杂项的科学公式。


关键数据

  • 精度提升30%:TS-DFM在Transition1x基准数据集上的平均结构预测精度较前期最优方法提升约30%

  • 跨类型泛化提升16%:在训练集未覆盖的全新反应类型上,TS-DFM预测性能较现有方法提升至少16%

  • 3万亿美元市场预测:据英国未来市场公司报告,全球物理AI市场预计将从2026年的3830亿美元增长至2040年的3.26万亿美元

  • 3830亿美元起点:2026年全球物理AI市场预估规模

  • 双系统协同:Deflex通过Deflexformer与Deflexpressor双引擎协同,实现从能量模型表征到符号公式生成的端到端流程


影响分析

TS-DFM与Deflex的同期发表,标志着AI for Science研究从"数据拟合"向"规律发现"的范式升级。两项成果的方法论创新具有广泛的学科辐射效应。

在化学与材料科学领域,TS-DFM为反应机理研究与催化剂设计提供了高效计算工具。传统过渡态搜索往往需要数百次量子化学能量评估,而TS-DFM可直接生成高质量初始结构,大幅加速计算流程。更重要的是,该方法能够探索训练集未覆盖的新反应类型,为发现未知反应路径提供了可能。

在基础科学研究领域,Deflex证明了神经符号方法在科学规律发现中的巨大潜力。从分子运动、流体动力学到群体行为,该方法成功复现了能量守恒、动量守恒、Maxwell-Boltzmann分布、Langevin动力学、Navier-Stokes方程等经典物理规律。这表明AI不仅能够拟合数据,更有可能"理解"物理世界的深层结构。

从学科交叉的角度看,两项研究均依托于数学与人工智能的深度融合------孙剑团队运用微分几何与最优传输理论,杨树森团队引入Lambda演算与形式化方法。这种以数学为基础的方法论创新,代表了AI for Science走向可解释性、可靠性发展的重要方向。

可以预见,随着这些工具的进一步优化与推广,AI将在药物设计、新材料发现、工程系统优化等领域发挥更重要的作用,加速科学研究的数字化与智能化转型。


编辑点评

西安交大数学与统计学院的两项成果同期发表于《自然·通讯》,绝非偶然巧合。这一"Math + AI for Science"双响的背后,是学院长期推动数学、人工智能与自然科学深度交叉的战略布局。

值得关注的是,孙剑团队的TS-DFM与杨树森团队的Deflex代表了两个互补的研究方向:前者解决"如何精确描述化学反应的动态演化",后者回答"如何从复杂数据中提炼简洁的数学规律"。二者的结合------即用可解释的数学公式描述化学反应的几何演化------可能是未来AI for Chemistry的重要突破口。

从更宏观的视角看,AI for Science正处于从"辅助工具"向"发现伙伴"演进的关键阶段。TS-DFM和Deflex的诞生表明,AI不仅能够加速科学研究的效率,更有望参与甚至主导新知识的创造。这一趋势对于科研范式的影响,或许才刚刚开始。