做材料科学领域研究热点:高通量多尺度材料计算和机器学习

研究背景

材料科学是一个重要领域,涉及物质的研究和利用。随着科技进步,材料学已成为多学科交叉的前沿领域之一,融合物理、化学、数学、信息、力学和计算科学等知识。寻找更坚固的新材料已成为当今急需解决的问题。

材料基因工程作为一项颠覆性的技术手段,汲取生物学基因理念,旨在加速新材料的研发和应用。其中,建立高通量计算设计平台 是其中关键一环。类似于生物基因组学的方法,通过大规模计算来预测和设计具有特定性能的材料 ,加速材料从设计到工程应用的过程,大幅提高新材料研发效率。这意味着更快速地将新材料推向市场,推动科技进步和产业发展。与传统材料研究相比,材料基因工程依赖于大数据分析和机器学习等技术,以发现新的材料组合和优化材料性能。

高通量多尺度材料计算和机器学习这个概念融合了高通量计算和多尺度模拟的技术,同时利用机器学习算法来优化和加速材料研究。

在高通量多尺度材料计算中,高通量计算技术利用大规模计算资源和并行处理能力,可以快速计算和预测材料的性能和特性,使得研究人员可以更快速地筛选和设计具有特定性能的材料 。另一方面,多尺度模拟技术可以从宏观到微观的不同尺度层级上对材料进行建模和模拟 ,揭示材料的结构和性能之间的关联,以更加全面地理解材料的行为,并为材料设计提供更准确的参考。在机器学习方面,通过对大量的实验数据和计算结果进行分析和挖掘,可以帮助研究人员发现隐藏在数据中的规律和趋势,从而加速材料设计和优化过程。

▲ 高通量材料计算驱动引擎的要素整合

高通量材料计算驱动引擎有效地整合了算法、算力、数据和知识

应用案例

该研究结果发表在Advanced Science(DOI: 10.1002/advs.201600517)

锂金属电池具有高能量密度,但锂金属的强还原性导致锂电池稳定性差。长期以来,人们一直在努力稳定锂金属负极,但由于对稳定材料化学的了解不足,这些努力受到了阻碍。

为了彻底解决金属锂的界面稳定性问题,马里兰大学莫一非教授课题组**采用基于量子力学第一性原理的高通量计算,发现并预测了对锂金属具有本征热力学稳定性的材料。**通过系统分析大量不同化学组分的化合物对锂金属的稳定性,该研究发现氮化物对锂金属具有本征的热力学稳定性。不同于此前常用的金属锂负极保护材料,如氧化物、硫化物、卤化物,具有本征锂金属稳定性的氮化物才是用于保护锂金属负极的理想材料。这一研究进一步预测了一系列目前尚未被开发的氮化物材料都具备提高金属锂负极稳定性的潜力。

该研究提出了一种新策略,即通过在表面和界面附近掺杂高含量的氮元素来提高锂金属界面稳定性。氮元素掺杂和添加高氮盐可以形成稳定的固态电解质界面膜(SEI),有效阻止金属锂负极与电解质的副反应,从而提高金属锂负极的库伦效率、稳定性和循环寿命。这一发现为材料选择提供了理论指导,并开辟了新的研究方向。

科研挑战

然而,对于企业级新材料研发,面临着如何避免数据碎片化,整合、研发或改进新材料研发生命周期过程中的离散数据、代码、模型和算法等,从而实现团队共享的问题。同时,面临着如何将高通量计算、高性能计算、机器学习等材料信息学方法和技术更好地与实验相结合,加快新材料研发的挑战。

在面向科研的材料计算方面,亦存在挑战:如何摆脱下载、安装、编译软件的繁琐流程,如何无需关注计算集群和机时的使用,直接在浏览器中进行计算,完成后即刻生成数据库。此外,还需面对课题团队的机时、存储、作业、任务、数据等方面的统一管理问题。

针对这些新材料数字化研究和开发的诸多难题,我国不仅在相关技术和平台方面存在缺失,更缺乏专门的介绍性书籍。

《高通量多尺度材料计算和机器学习》 基于计算、数据、AI和实验 "四位一体"的新材料集成式智能化研发理念,提出了基于材料基因编码的新材料智能设计范式,从企业级新材料研发和面向科研的材料计算视角,重点围绕高通量材料集成计算、多尺度材料计算模拟、材料数据库、材料数据机器学习、新材料研发制造软件等介绍了新材料数字化智能化研发和设计基本概念、方法、技术和应用。

《高通量多尺度材料计算和机器学习》 (北京:科学出版社, 2023.8)作者杨小渝研究员曾在英国剑桥大学从事博士后研究,现为中科院计算机网络信息中心"百人计划"A 类研究员,中国科学院大学岗位教授,拥有10 多年的高通量材料集成计算、多尺度计算模拟、材料数据库、材料信息学等软件和集成平台研发经验和成果积累。作者承担了"十三五"国家重点研发计划"材料基因工程重点专项"课题"高通量材料计算大数据处理技术"(2016YFB0700501),研发了高通量多尺度材料集成设计工业软件MatCloud,并实现了开放应用,是我国在该领域的优秀科学家。

谢建新

北京科技大学教授

中国工程院院士

2023 年7 月

← 左右滑动查看 详细信息

作者于2000 年赴英国攻读计算机及应用专业硕士和博士,2005 年博士毕业后前往英国剑桥大学地球科学系开展e-Science 博士后研究,在那里开始接触材料计算和材料信息学,其间发表了10 余篇有关材料计算和数据基础设施建设的论文及3 部专著。2011 年6 月美国材料基因组计划的提出引领了新材料研发范式的变革,作者便于2012 年回国带领团队从事材料基因工程高通量材料计算和数据库平台的研发。当时高通量材料计算尚属前沿技术,在中国科学院计算机网络信息中心的支持下,从"0"到"1",我们研发了当时国内首个高通量材料计算和材料数据库云平台MatCloud ,并于2015 年上线运行(见中文核心期刊《科技导报》,2016, 34(24): 62-67)。2018 年MatCloud 成功实现了成果转化(MatCloud+)。经过10 多年的持续研发和迭代,MatCloud 已100%商业化落地 ,它以高通量、多尺度、云原生、图形化等为特点,实现了材料计算的"建模→ 计算→ 数据→AI"全流程和云端自动化,基本可实现对国外同类软件的替代。

▲ MatCloud+的核心模块和交互

截至2023 年6 月,全球注册用户已突破6000,涵盖300 多家高校、科研院所和企业,覆盖10 多个国家和地区,已举办线上线下各类培训近100场,培训用户数累计近3500 人次,取得了较好的社会与经济效益,得到北京市科学技术委员会的高度关注与支持。目前,国际上真正实现了高通量多尺度材料计算的云平台主要有美国的Mat3ra (www.mat3ra.com) 和韩国的Materials Square(www.materialssquare.com) 。作为中国高通量多尺度材料计算云平台的卓越代表,MatCloud(www.matcloud.com.cn) 的部分功能已超越Mat3ra 和Materials Square。

MatCloud 研发得到了国家自然科学基金项目"材料基因组计划高通量材料集成计算关键技术和服务平台研究"和科技部"十三五"国家重点研发计划"材料基因工程重点专项"课题"高通量材料计算大数据处理技术"的支持,也是"十三五"材料基因工程重点专项"材料基因工程关键技术与支撑平台"的代表性成果之一,取得的一系列研究及应用成果相继在Scientific Data(Nature 子刊)、Computational Material Science(IF3.3, JCR Q1)、Nanoscale (IF 7.79,JCR Q2)、Electrochim Acta (IF 6.901, JCR Q2)、Carbon (IF 9.593, JCR Q1)、Chinese Physics B (IF1.494/JCRQ3) 等多个国际国内知名期刊发表。

为了让从事新材料研发和创新的研究人员更加清晰地把握高通量多尺度材料计算和机器学习,作者于2016 年萌生了出版高通量材料计算专著的想法,2017年开始撰写,历时4 年,几经打磨,于2021 年完成近40 万字的初稿。2022 年获得国家科学技术学术著作出版基金的资助,经进一步修改和完善最终定稿。《高通量多尺度材料计算和机器学习》(杨小渝著. 北京:科学出版社, 2023.8)一书提出了基于材料基因编码的新材料智能设计范式,从企业级新材料研发和面向科研的材料计算视角,讲述了高通量材料集成计算与新材料智能设计。

重点围绕如何通过计算与数据的集成、计算数据与实验数据的集成、高通量计算与多尺度模拟的集成以及数据与AI 的集成,促进基于计算、数据、AI 和实验"四位一体"的"理论设计优先,实验验证在后"的新材料研发新业态、新模式和新文化。从高通量材料集成计算、多尺度材料计算模拟、材料数据库、材料数据机器学习、新材料研发制造软件等介绍了新材料数字化研发基本概念、方法、技术及国产的新材料研发集成设计工业软件MatCloud+,并以一些案例介绍这些数字化研发方法和技术在重点材料行业的应用。

本书内容源自原始文献和作者在本领域多年的积累,重点阐述基本概念、基本理念、方法和应用实践,适合于计算材料、计算物理、计算化学等领域和方向的研究人员、学生或教师参考,也适合于涉及新材料研发的企业、制造业和政策层面参考。

相关推荐
tangjunjun-owen3 分钟前
第四节:GLM-4v-9b模型的tokenizer源码解读
人工智能·glm-4v-9b·多模态大模型教程
冰蓝蓝8 分钟前
深度学习中的注意力机制:解锁智能模型的新视角
人工智能·深度学习
橙子小哥的代码世界16 分钟前
【计算机视觉基础CV-图像分类】01- 从历史源头到深度时代:一文读懂计算机视觉的进化脉络、核心任务与产业蓝图
人工智能·计算机视觉
新加坡内哥谈技术1 小时前
苏黎世联邦理工学院与加州大学伯克利分校推出MaxInfoRL:平衡内在与外在探索的全新强化学习框架
大数据·人工智能·语言模型
fanstuck2 小时前
Prompt提示工程上手指南(七)Prompt编写实战-基于智能客服问答系统下的Prompt编写
人工智能·数据挖掘·openai
lovelin+v175030409662 小时前
安全性升级:API接口在零信任架构下的安全防护策略
大数据·数据库·人工智能·爬虫·数据分析
唐小旭2 小时前
python3.6搭建pytorch环境
人工智能·pytorch·python
洛阳泰山2 小时前
MaxKB基于大语言模型和 RAG的开源知识库问答系统的快速部署教程
人工智能·语言模型·开源·rag·maxkb
程序猿阿伟2 小时前
《Java 优化秘籍:计算密集型 AI 任务加速指南》
java·开发语言·人工智能
说私域2 小时前
社交媒体形象打造中的“号设化”与开源AI智能名片商城小程序的应用
人工智能·小程序·媒体