中国科大团队开发用于原子系统对外部场响应的通用机器学习模型

机器学习的原子间相互作用势使得封闭系统的高效、准确的分子模拟成为可能。然而,可以极大地改变化学结构或反应性的外部场,很少被包含在当前的机器学习模型中。

中国科学技术大学的研究人员提出了一种通用场诱导递归嵌入原子神经网络(field-induced recursively embedded atom neural network,FIREANN)模型,该模型将伪场矢量依赖特征整合到原子描述符中,以表示具有严格旋转等变性的系统-场相互作用。

这种「一体式」方法将偶极矩和极化率等各种响应特性与单个模型中的场相关势能相关联,非常适合在存在电场的情况下对分子和周期系统进行光谱和动力学模拟。特别是对于周期系统,FIREANN 可以通过仅训练原子力来克服极化的内在多值问题。

该研究以「Universal machine learning for the response of atomistic systems to external fields」为题,于 2023 年 10 月 12 日发布在《Nature Communications》。

外部场和化学系统之间的相互作用在一系列物理、化学和生物过程中至关重要。通过与原子、分子或凝聚态物质相互作用,外部(主要是电场)可以引起系统的电子/自旋极化和空间取向;它提供了改变化学结构、促进电子转移、控制材料的相变或生物分子的构象转变、巧妙地操纵催化中的化学反应性和选择性以及冷化学反应中的量子动力学的特殊方法。

精确的场相关量子散射计算仅适用于非常小的系统。基于现代极化理论的密度泛函理论(DFT)和从头算分子动力学(AIMD)模拟已更普遍地应用于研究存在外部电场的更复杂的非周期和周期系统。然而,AIMD 方法的要求仍然非常高,尤其是当核量子效应(NQE)很重要时。

尽管经验力场可以非常高效,但其准确性受到经验函数和相互作用哈密顿量的近似表达式的限制。例如,常用的偶极子场近似将电场对系统的扰动截断为一阶(即仅包括与永久偶极子的相互作用),并忽略与极化性、超极化性等等。此外,除了这些反作用力场之外,大多数都无法描述键的断裂/形成。

近年来,机器学习(ML)方法在解决化学高维问题方面取得了革命性的成功。人们已经开发出各种用于准确表示势能面(PES)的机器学习模型。其中一些已扩展到学习张量特性,例如具有正确旋转等变性的偶极矩和极化张量,从而实现电子和振动光谱的高效无场模拟。然而,大多数机器学习模型分别处理势能及其对电场的响应特性,而没有捕获场依赖性。

在最新的研究中,通过在原子环境的描述中引入简单的场相关特征,中国科学技术大学的研究人员开发了一种场诱导递归嵌入原子神经网络(FIREANN)模型,该模型具有与外部场相互作用的系统的正确旋转等变性。

在不截断场引起的相互作用的情况下,FIREANN 不仅描述了能量随施加场强和方向的变化,而且还同时描述了(原则上)任何阶数的相关响应属性。基于路径积分的分子动力学 (MD) 模拟与训练有素的 FIREANN 模型可在存在电场的情况下产生代表性分子和凝聚相系统的可靠的从头算光谱。

该模型的一个显著特征是,它可以通过仅学习原子力来绕开周期系统中极化的多值问题,这是现有机器学习模型中众所周知但很大程度上被忽视的事实。

图示:FIREANN框架示意图。(来源:论文)

该模型使研究人员能够从一次训练中获得所有成分,以对有或没有外部电场的化学系统的光谱和动力学进行建模。NMA分子和液态水的预测振动光谱与无场实验数据之间的良好一致性支持了该模型的有效性。此外,在现场红外或拉曼光谱中可以清楚地预测场诱导的偶极矩排列和共价键的软化。

特别是对于像液态水这样的周期性系统,系统固有的多值极化导致训练数据中偶极矩不连续,很难用基于原子电荷的传统机器学习模型来表示。在 FIREANN 模型中,通过仅学习原子力,可以很好地绕过这个问题,原子力可以产生场相关势和偶极矩,从而产生液态水的红外光谱。该团队的结果不仅清楚地验证了一体化 FIREANN 模型的高精度,而且还阐明了化学系统和电场之间的相互作用。

图示:液态水的无场和场内红外光谱。(来源:论文)

在当前基于原始 PyTorch 框架的实现中,在最完整的场景中训练 FIREANN 模型将比仅强制训练花费 4 倍的时间,因为前一个过程需要样本到样本(高阶)梯度。这个问题可以通过基于新版本 PyTorch 中最近发布的 functorch 模块的改进实现来很大程度上缓解,该模块允许高效计算样本到样本(高阶)梯度。

需要注意的是,当前版本的 FIREANN 模型仅限于描述均匀外场的影响。在非均匀外场的情况下,电子密度对场的响应是空间相关的,必须明确考虑。

一种可行的方法是将非均匀场离散化到每个原子中心,并向每个FI-EAD特征引入非等价的场相关函数,以近似每个原子密度对中心原子所经历的局部场的响应。该调整旨在引入与整个系统相互作用的外部非均匀场。这与大约由溶剂环境产生的不均匀电场不同,后者仅作用于嵌入分子中心。

这些理想的特征使得 FIREANN 方法非常有希望有效地模拟强场诱发的现象,例如电化学、等离子体化学和尖端诱发的催化反应。

论文链接:www.nature.com/articles/s4...

相关推荐
redreamSo12 小时前
AI Daily | AI日报:ChatGPT识破10年顽疾,医疗AI震撼登场; 微信支付MCP开放,机遇与风险并存; 蒙娜丽莎图让大模型几乎全军覆没
程序员·aigc·资讯
redreamSo1 天前
AI Daily | AI日报:马斯克Grok 4跑分泄露,有望改写LLM格局; 猫猫话术让大模型数学答错率翻3倍; 安克创新All in AI,代码采纳率破50%
程序员·aigc·资讯
德育处主任2 天前
键盘简史:从打字机到机械轴,怎么还是QWERTY布局啊?
资讯
redreamSo2 天前
AI Daily | AI日报:Nature:超14%生物医学论文或由AI代写; Grok 4测试成绩优异,数据真实性引争议; 李飞飞:攻克空间智能,为AGI补拼图
程序员·aigc·资讯
三花AI3 天前
阿里开源 OmniAvatar:音频驱动数字人模型
开源·资讯
NocoBase3 天前
为什么越来越多 Airtable 用户开始尝试 NocoBase?
低代码·开源·资讯
redreamSo3 天前
AI Daily | AI日报:LinkedIn:90% 应用迁移,弃 Kafka 用 Northguard; 谷歌发布免费AI教育功能,重塑课堂!; 小扎143亿请新贵,Meta员工冰火两重天
程序员·aigc·资讯
不摸鱼4 天前
顶级AI评论员:算力狂飙撞墙后,AI的下一场革命靠什么?| 不摸鱼的独立开发者日报(第43期)
人工智能·开源·资讯
NocoBase13 天前
Airtable 的数据超出上限,3 种常见应对方式
低代码·开源·资讯
redreamSo13 天前
AI Daily | AI日报:Anthropic:主流AI模型或成“内鬼”; 微软发布Mu模型,小参数跑出10倍性能; 斯坦福2025 CS336课程全公开搓大模型
程序员·aigc·资讯