中国科大团队开发用于原子系统对外部场响应的通用机器学习模型

机器学习的原子间相互作用势使得封闭系统的高效、准确的分子模拟成为可能。然而,可以极大地改变化学结构或反应性的外部场,很少被包含在当前的机器学习模型中。

中国科学技术大学的研究人员提出了一种通用场诱导递归嵌入原子神经网络(field-induced recursively embedded atom neural network,FIREANN)模型,该模型将伪场矢量依赖特征整合到原子描述符中,以表示具有严格旋转等变性的系统-场相互作用。

这种「一体式」方法将偶极矩和极化率等各种响应特性与单个模型中的场相关势能相关联,非常适合在存在电场的情况下对分子和周期系统进行光谱和动力学模拟。特别是对于周期系统,FIREANN 可以通过仅训练原子力来克服极化的内在多值问题。

该研究以「Universal machine learning for the response of atomistic systems to external fields」为题,于 2023 年 10 月 12 日发布在《Nature Communications》。

外部场和化学系统之间的相互作用在一系列物理、化学和生物过程中至关重要。通过与原子、分子或凝聚态物质相互作用,外部(主要是电场)可以引起系统的电子/自旋极化和空间取向;它提供了改变化学结构、促进电子转移、控制材料的相变或生物分子的构象转变、巧妙地操纵催化中的化学反应性和选择性以及冷化学反应中的量子动力学的特殊方法。

精确的场相关量子散射计算仅适用于非常小的系统。基于现代极化理论的密度泛函理论(DFT)和从头算分子动力学(AIMD)模拟已更普遍地应用于研究存在外部电场的更复杂的非周期和周期系统。然而,AIMD 方法的要求仍然非常高,尤其是当核量子效应(NQE)很重要时。

尽管经验力场可以非常高效,但其准确性受到经验函数和相互作用哈密顿量的近似表达式的限制。例如,常用的偶极子场近似将电场对系统的扰动截断为一阶(即仅包括与永久偶极子的相互作用),并忽略与极化性、超极化性等等。此外,除了这些反作用力场之外,大多数都无法描述键的断裂/形成。

近年来,机器学习(ML)方法在解决化学高维问题方面取得了革命性的成功。人们已经开发出各种用于准确表示势能面(PES)的机器学习模型。其中一些已扩展到学习张量特性,例如具有正确旋转等变性的偶极矩和极化张量,从而实现电子和振动光谱的高效无场模拟。然而,大多数机器学习模型分别处理势能及其对电场的响应特性,而没有捕获场依赖性。

在最新的研究中,通过在原子环境的描述中引入简单的场相关特征,中国科学技术大学的研究人员开发了一种场诱导递归嵌入原子神经网络(FIREANN)模型,该模型具有与外部场相互作用的系统的正确旋转等变性。

在不截断场引起的相互作用的情况下,FIREANN 不仅描述了能量随施加场强和方向的变化,而且还同时描述了(原则上)任何阶数的相关响应属性。基于路径积分的分子动力学 (MD) 模拟与训练有素的 FIREANN 模型可在存在电场的情况下产生代表性分子和凝聚相系统的可靠的从头算光谱。

该模型的一个显著特征是,它可以通过仅学习原子力来绕开周期系统中极化的多值问题,这是现有机器学习模型中众所周知但很大程度上被忽视的事实。

图示:FIREANN框架示意图。(来源:论文)

该模型使研究人员能够从一次训练中获得所有成分,以对有或没有外部电场的化学系统的光谱和动力学进行建模。NMA分子和液态水的预测振动光谱与无场实验数据之间的良好一致性支持了该模型的有效性。此外,在现场红外或拉曼光谱中可以清楚地预测场诱导的偶极矩排列和共价键的软化。

特别是对于像液态水这样的周期性系统,系统固有的多值极化导致训练数据中偶极矩不连续,很难用基于原子电荷的传统机器学习模型来表示。在 FIREANN 模型中,通过仅学习原子力,可以很好地绕过这个问题,原子力可以产生场相关势和偶极矩,从而产生液态水的红外光谱。该团队的结果不仅清楚地验证了一体化 FIREANN 模型的高精度,而且还阐明了化学系统和电场之间的相互作用。

图示:液态水的无场和场内红外光谱。(来源:论文)

在当前基于原始 PyTorch 框架的实现中,在最完整的场景中训练 FIREANN 模型将比仅强制训练花费 4 倍的时间,因为前一个过程需要样本到样本(高阶)梯度。这个问题可以通过基于新版本 PyTorch 中最近发布的 functorch 模块的改进实现来很大程度上缓解,该模块允许高效计算样本到样本(高阶)梯度。

需要注意的是,当前版本的 FIREANN 模型仅限于描述均匀外场的影响。在非均匀外场的情况下,电子密度对场的响应是空间相关的,必须明确考虑。

一种可行的方法是将非均匀场离散化到每个原子中心,并向每个FI-EAD特征引入非等价的场相关函数,以近似每个原子密度对中心原子所经历的局部场的响应。该调整旨在引入与整个系统相互作用的外部非均匀场。这与大约由溶剂环境产生的不均匀电场不同,后者仅作用于嵌入分子中心。

这些理想的特征使得 FIREANN 方法非常有希望有效地模拟强场诱发的现象,例如电化学、等离子体化学和尖端诱发的催化反应。

论文链接:www.nature.com/articles/s4...

相关推荐
蚝油菜花15 天前
王炸!Anthropic 推出全新模型 Claude 3.5 Haiku,首发支持计算机使用功能!
人工智能·llm·资讯
三花AI18 天前
Playground V3:图形设计模型的文字处理新标杆
开源·资讯
万界星空科技1 个月前
万界星空科技MES系统与各大系统的集成
产品·运营·资讯
战场小包3 个月前
OpenAI动荡,将走向何方、GPT5或许将近、毒舌AI轻松破防网友、最新版 GPT-4o AI 模型得满分 | AGI掘金视界周刊第 4 期
人工智能·资讯
字节跳动开源3 个月前
字节跳动开源多云多集群管理引擎 KubeAdmiral v1.0.0 发布!
开源·github·资讯
战场小包3 个月前
AI视界周刊第 2 期:里程碑 Llama 3.1 开源、AI训AI,越训越傻、AI 搜索重燃战火
人工智能·资讯
栩栩云生3 个月前
[240726] Mistral AI 发布新一代旗舰模型 | Node.js 合并 TypeScript 文件执行提案
typescript·node.js·资讯
赵侠客3 个月前
使用Hutool要注意了!升级到6.0后你调用的所有方法都将报错
java·后端·资讯
栩栩云生4 个月前
[240706] 史蒂夫·乔布斯近40年前就预言了苹果智能 | Globalping 用于网络诊断和性能测试的命令行工具
命令行·apple·资讯
栩栩云生5 个月前
[240622] X-CMD 发布 v0.3.12: 引入 codeberg,增强传统命令,改善对 Elvish 和 Fish 支持
开源·命令行·资讯