33 分钟生成 12 万种碳捕捉候选材料,美国阿贡国家实验室发布生成式 AI 框架,加速 MOFs 创新

在工业化飞速发展的大环境下,地球正面临着一个严峻而急迫的问题一一过度的二氧化碳排放。二氧化碳就像是一层无形的厚茧裹住了人类赖以生存的家园,悄然改变着全球的气候,也带来了诸如极端天气频发、生态系统重创、农业生产受阻和公共卫生挑战等一系列连锁反应。

作为一种解决二氧化碳高排放的前沿手段,碳捕捉技术的创新与发展显得尤为重要,得到了更加广泛的关注。该技术是利用物理或化学方法,从大型排放源中提取二氧化碳,并对其进行处理,避免二氧化碳直接进入大气中,从而达到减排的目的。

近年来,一种名为金属有机框架 (Metal-Organic Frameworks,简称 MOFs) 的新型多孔晶体材料,因其独特的结构和性能引起了众多研究者的广泛关注。MOFs 由金属离子与有机配体通过配位键自组装而成,相较于传统的活性炭、分子筛等固体吸附剂,它们更环保、能耗更低,在二氧化碳吸附方面展现出更好的性能。

然而,目前 MOFs 的生产设计通常依赖于大量的实验数据和计算工作,既昂贵又耗时。为此,来自美国阿贡国家实验室的研究团队,提出了一种生成式 AI 框架 GHP-MOFsassemble, 该框架能够随机生成并组装新的 MOFs 结构,通过分子动力学模拟筛选高稳定性的 MOFs 结构,并用晶体图神经网络 (Crystal Graph Convolutional Neural Network, CGCNN) 和 Grand Canonical Monte Carlo simulations 来测试 MOFs 对二氧化碳的吸附能力。结果显示,该方法在 33 分钟内就快速组装出 12 万个新的候选 MOFs,极大促进了 MOFs 设计的未来发展。

研究亮点:

  • 生成式 AI 框架 GHP-MOFsassemble 在 33 分钟内快速组装出 12 万个新的候选 MOFs

  • 该方法能够降低构建大型数据库的高昂成本

论文地址:
www.nature.com/articles/s4...

一键下载数据集:

bit.ly/3IlrvQl
关注公众号,后台回复「MOFs」获取完整 PDF

三大结构组成高通量计算框架

研究人员提出的 GHP-MOFsassemble 方法是一种新型的高通量计算框架,该框架主要包括三个组成部分:分解 (Decompose)、生成 (Generate) 、筛选与预测 (Screen and Predict)。

Decompose:用 MMPA 分解 hMOFs 数据集

研究选择的 hMOFs 是一个高性能金属有机骨架材料 (High-performance Metal-Organic Frameworks) 的相关数据集,其中包含了经过筛选或实验验证的高性能 MOFs 结构信息。

Zn tetramer-pcu MOFs的分解步骤

碳为灰色,氧为红色,氮为蓝色,氢为白色

在 hMOFs 数据集中,频繁出现三种类型的拓扑结构------Cu PW-pcu, Zn PW-pcu 和 Zn TM-pcu,这三种类型的结构占数据集总数的 74%,共 102,117 个 hMOF 结构。研究人员选取了其中具有正确解析的 MOFids 和有效的 SMILES 结构,共 78,238 个 MOF 结构数据。

SMILES:Simplified molecular input line entry system,简化分子线性输入规范

hMOFs 数据集属性

研究人员选取了从高性能 hMOF 结构中提取了 540 个分子片段(上表最后一列),通过匹配分子对算法 (MMPA) 对 540 个独特结构进行分解,并提取其分子片段。使用 DiffLinker 生成新的 MOFs 连接物。

Generate:扩散模型生成新 MOFs 连接物

Zn tetramer-pcu MOFs结构的生成步骤碳为灰色、氧为红色、氮为蓝色、氢为白色

对于 GHP-MOFassemble 框架中的生成部分,首先,研究人员提取上述 540 个独特结构的分子片段,利用扩散模型 DiffLinker 生成新的 MOFs 连接物。

在这一过程中,研究人员利用 openbabel 添加氢原子,并删除具有错误氢分配的连接物,执行虚拟原子识别过程,生成能够与金属节点组装的信息,随后再经过元件过滤器处理,最终得到了 12,305 个连接物。最后,随机选取三个由 DiffLinker 生成的连接物和一个在 hMOFs 数据集中频繁出现的金属节点进行组装。

据悉,研究人员在阿贡国家实验室 (ALCF) 的 Theta 超级计算机上,在 33 分钟内便生成了 12 万 个具有 pcu 拓扑结构的新 MOFs。

Screen and Predict:CGCNN 模型测试二氧化碳吸附能力

研究人员对得到的新 MOFs 结构进行了几何结构检查,在 40 分钟内确定了 78,796 个具有有效键长的 MOF。随后还进行了预模拟检查,在不到 4 小时内(205 分钟)确定了有 18,770 个 MOFs 成功生成了 LAMMPS输入文件。为了减少 LAMMPS 的模拟次数,研究人员训练了一个 CGCNN 模型对 MOFs 的吸附性能进行了筛选。

LAMMPS:Large-scale Atomic/Molecular Massively Parallel Simulator,大规模原子分子并行模拟器

CGCNN 模型训练过程:使用 hMOF 数据集中的 MOFs 结构及其在 0.1 bar 时二氧化碳吸附量作为输入数据。将 hMOF 数据集分成三个独立的数据集:80% 用于训练,10% 用于验证,10% 用于测试。通过这种数据分割,使用随机权重初始化的方法训练了 3 个 CGCNN 模型。

通过在 NVIDIA A40 GPU 上基于 CGCNN 模型进行训练,研究人员对上述 18,770 个通过筛选的 MOFs 结构进行二氧化碳吸附能力的预测,将其中得到的 364 个吸附性能高的 MOFs 结构进行分子动力学模拟,整个 AI 推理过程在 50 分钟内完成。

总结来看,研究人员基于 GHP-MOFsassemble 框架,在 5 小时 7 分钟内完成了 MOFs 新结构的生成与高性能结构的筛选等全流程。

基于GCMC模拟和CGCNN模型

6种MOFs分别在0.1bar和300K下的二氧化碳吸附量

最终,研究人员确定了 102 个稳定且高性能的 MOFs 结构,并对这 102 个 MOFs 进行 Grand Canonical Monte Carlo (GCMC) 模拟, 计算它们在 0.1 bar 和 300K 条件下的二氧化碳吸附能力,发现了 6 个二氧化碳吸附能力高于 2 m mol g−1 的 MOFs,这 6 种 MOFs 的晶体结构如下:

6种MOFs的晶体结构

碳为灰色,氮为深蓝色,氟为青色,锌为紫色,氢为白色,锂为绿色

实验结论:AI 框架可以生成有效的新型 MOFs

AI生成的配体与hMOFs配体之间相似性的分布情况

研究人员将基于 AI 框架生成的配体与 hMOFs 配体进行相似度分析,发现 AI 生成的配体与 hMOFs 中的配体相似度仅为 30%-40%,这说明 AI 框架能够生成新的配体。

0.4 处相似度的高峰值又表明 AI 能够生成类似 hMOFs 中已有的配体,即可说明此 AI 框架下生成的 MOFs 具有实际有效性。

值得一提的是,尽管 GHP-MOFassemble 能够成功发现和验证具有优异性能的金属有机框架结构,但它并不完美。实验过程的筛选规则、模拟条件和模型的精确度都将影响结果的准确性,由该 AI 框架筛选出来的 MOFs 的性能也还需要在实验中进一步验证。

AI 深入碳捕捉,英伟达模拟速度飙升 70 万倍

现今,应对气候变化已经上升为一项全球性挑战,关系到全人类的共同未来。我国政府对此给予高度重视,并设定了清晰的减排路径:计划于 2030 年前二氧化碳排放达到峰值,争取 2060 年前实现碳中和。当「碳达峰」与「碳中和」的愿景与 AI 数字化科技相碰撞,将会催生一系列的未来变革。实际上,人工智能一直在为低碳寻找解决方案。

人工智能助力城市「双碳」目标的总体框架图

来源:百度智能云

微软曾表示,AI 技术能够利用大量来源不同渠道的数据进行复杂问题的解决,从而助力全球生产力的提升,并在降低二氧化碳及其它温室气体排放方面发挥作用。 另外,萨里大学教授 Jin Xuan 也曾在其研究中表明,借助 AI 模型,可能将燃煤发电厂碳捕捉设施的能源消耗减少 1/3 以上,提高二氧化碳捕捉效率至少 16.7%。

此外,英伟达也发布了全栈式开放平台 Earth-2,可通过交互式高分辨率模拟加速气候和天气预报。同时,英伟达使用里叶神经算子和神经网络框架 NVIDIA Modulus,将碳捕捉和存储的模拟分析速度提高 70 万倍,2.8 秒即可完成对二氧化碳羽流和压力累积的可靠性评估,这一提升无疑为后续的碳捕捉研究提供了技术支持。

面对日益严重的环境压力和生态警示,推动碳捕捉技术的突破与应用,已不再仅仅是一个科学命题,更是关乎人类可持续发展的时代课题。将 AI 技术融入碳捕捉过程,特别是在设计金属有机框架 (MOFs) 等新型材料领域,将有望带来新一轮的科技突破,助推全球经济社会体系朝着更加绿色、低碳的方向转型。

参考资料:

1.https:www.ambchina.com

2.https:www.nvidia.cn/high-perfor...

3.www.tanpaifang.com/CCUS/202307...

4.m.xinhuanet.com/tech/2021-0...

相关推荐
Ai 编码助手4 小时前
MySQL中distinct与group by之间的性能进行比较
数据库·mysql
陈燚_重生之又为程序员5 小时前
基于梧桐数据库的实时数据分析解决方案
数据库·数据挖掘·数据分析
caridle5 小时前
教程:使用 InterBase Express 访问数据库(五):TIBTransaction
java·数据库·express
白云如幻5 小时前
MySQL排序查询
数据库·mysql
萧鼎5 小时前
Python并发编程库:Asyncio的异步编程实战
开发语言·数据库·python·异步
^velpro^5 小时前
数据库连接池的创建
java·开发语言·数据库
荒川之神5 小时前
ORACLE _11G_R2_ASM 常用命令
数据库·oracle
IT培训中心-竺老师5 小时前
Oracle 23AI创建示例库
数据库·oracle
WaaTong5 小时前
《重学Java设计模式》之 单例模式
java·单例模式·设计模式
小白学大数据5 小时前
JavaScript重定向对网络爬虫的影响及处理
开发语言·javascript·数据库·爬虫