"AI for Science"时代,机器学习分子动力学+机器学习第一性原理专题!https://mp.weixin.qq.com/s/icdBcJbKhOqtAymEpZds2A
《基于机器学习的分子动力学》
1. 第一天理论内容
a) 诺贝尔奖的AI元年
i. AI与 SCIENCE的交叉:
b) 科学研究的四范式
i. 从大数据时代到AI4SCIENCE时代,如Google DeepMind/微软研究院/Meta FAIR等著名AI团队的AI4SCIENCE工作介绍
c) AI4SCIENCE时代的分子动力学模拟
i. 分子模拟基本方法与发展历史
ii. 经验力场与第一性原理方法的对比与区别
iii. 机器学习力场方法的兴起
d) 基于机器学习的分子动力学方法在各个领域的应用情况与发展趋势,以及相关支撑项目
e) 机器学习的分子动力学的特点,分类和工作流程
f)数据集的常见收集方式与建议
- 实操内容
a) Linux系统与超算服务器的常规操
i. ls/ll/cd/cp/mv/cat/pwd/less/tail/mkdir/touch以及vim的常见操作
b) 虚拟环境(Anaconda或Mamba)的使用
i. conda create/activate/deactivate/install/info/env等命令
c) Python的集成开发环境(IDE)的介绍与基本使用
i. Python的基本数据类型
ii. Pycharm的常见用法与代码调试,以及虚拟环境的配套
d) 分子模拟软件介绍
i. LAMMPS的入门与使用
-
软件发展趋势与特点
-
大规模并行的原理:域分解算法介绍
-
输入文件的详细解析与注意事项
-
相关势函数和晶格常数的获取渠道
-
分子模拟轨迹的后处理与分析:径向分布函数与扩散系数
-
机器学习势函数在LAMMPS中的使用
ii. OpenMM的入门与使用
-
软件发展趋势与方法特点
-
运行脚本与注意事项
-
GAFF(Amber)力场的简要介绍
-
使用sobtop软件和Python快速、自动化生成任意有机分子的力场参数文件(同时也适用GROMACS)
e)量子化学计算软件的介绍与快速上手
i.量子化学中常见理论方法的分类与区别,DFT相关泛函的简要介绍
ii. CP2K软件的介绍与快速上手:
-
软件发展趋势与特点
-
安装与使用,以及赝势文件的介绍与获取
-
使用MULTIWFN软件快速生成CP2K的单点能或分子动力学模拟的输入文件
-
输入文件的字段解释与注意事项
-
使用Python实现自动化提交任务与任务后处理
-
在CP2K中使用GFN1-xTB方法,适合新手快速入门的理论方法
iii. ORCA软件的介绍与特点:
-
软件发展趋势与特点
-
使用MULTIWFN软件快速生成单点能或分子动力学模拟的输入文件,以及注意事项
-
使用Python实现自动化提交任务与任务后处理
-
ωB97M-V泛函的介绍与在ORCA中的使用
iv.XTB软件的发展介绍与特点:
1.软件发展趋势与特点:发展迅猛!年被引用增长率高达87%;能够执行单点能,几何优化,分子模拟等功能
-
安装与常用命令
-
GFN系列方法的简要介绍
-
使用Python实现自动化提交任务与任务后处理
v. DFTB(简单介绍)
-
执行单点能,几何优化,分子模拟等
-
使用Python实现自动化提交任务与任务后处理
f) 案例:传统力场方法与机器方法力场方法的对比
i. 使用OpenMM执行有机体系的分子模拟
ii. 基于机器学习力场方法,结合LAMMPS执行合金体系,锂电池体系的分子模拟
iii. 使用MDtraj等软件进行模拟结果的后处理分析与Python高质量科研绘图,包括:能量与力的预测曲线,径向分布函数,键长键角二面角分布,电池电压曲线等.
3. 第二天理论内容(机器学习力场的模型设计)
a) 机器学习与深度学习的快速入门
i. 常见概念与分类
ii.机器学习的发展历史以及通用近似理论:
1.通过交互的可视化案例,理解神经网络的通用近似理论
- 解释神经网络对GPU的依赖
iii. 神经元,反向梯度下降,损失函数,过/欠拟合,残差连接等基本概念
iv. ANN, CNN, RNN, TRANSFORMER,ResNet等经典深度神经网络的基本框架的介绍与特点
v. 相关学习资源的推荐
vi. Pytorch与Tensorflow的发展现状
b) 科学领域的机器学习模型介绍
i.AI模型在SCIENCE领域需要遵守的几个物理约束/物理对称性
ii.高效描述局部环境方法的分类与特点
-
基于核方法或深度神经网络方法
-
基于描述符或分子图方法
iii. 基于描述符的机器学习力场模型
- HDNNPs(BPNN)模型详解与发展
a) 机器学习力场的开篇工作
-
有机体系的ANI模型的介绍
-
生态最好的机器学习力场模型
a) DeePMD系列工作的详解
b) DeePMD的发展和几种描述符的介绍,特点与应用
c) DeePMD的压缩原理与特点
d) DPGEN的工作原理
iv. 基于图框架的机器学习力场模型
-
图神经网络、图卷积网络和消息传递神经网络的发展与理解
-
图神经网络的机器学习力场模型的经典模型
-
SchNet模型的特点与代码实现
4.基于三维空间建模的完备性与效率的几何系列模型:
a)DimeNet, SphereNet和ComENet模型的详解与比较
- 其他机器学习力场模型概述:DTNN和PhysNet等
c) 实操内容
i. DeePMD的离线安装与验证测试
ii. DeePMD输入文件详解:与理论课的模型框架相对应地进行超参数设定的讲解,及使用经验
iii. DeePMD的常见功能,包括训练,重启,冻结,压缩和测试
iv. DeePMD的常见问题与训练过程的分析
v. 综合使用LAMMPS和DeePMD, 执行高精度的分子动力学模拟
vi. 分子模拟的数据后处理与分析
vii. DPGEN软件的安装,介绍与工作流程
viii. DPGEN软件的输入和输出文件:param.json和machine.json文件的参数详解
ix. DPGEN软件跨计算分区的提交任务示例;不同量化级别方法的示例
x. DPGEN软件的常用命令与使用经验,以及不同体系收敛的参考标准
4. 第三天(高级课程 ------ 等变模型系列,领域热点)
a) 不变系列模型的总结
b)等变模型的概念,特点,分类和应用
c)等变的概念
d) 等变模型的分类与特点
e) 高阶等变模型的介绍:超高数据利用率与优秀的泛化能力
f) 群的简要介绍
g) SO(3)群的简单入门与张量积
h) 欧式神经网络(E3NN)的介绍与注意事项
i) 高阶等变模型与传统模型,经验力场的区别
j) 常见误区的提醒
k) 等变机器学习力场的经典模型
i. Nat. Commun.上高被引的NequIP模型的详解和代码框架
l) 实操内容
i. DeePMD软件的进阶使用与补充讲解,包括多GPU并行训练
ii. LAMMPS以多GPU并行方式运行机器学习力场模型
iii. 使用Python代码快速可视化机器学习力场模型在等变与不变设计上的区别
iv. 使用多种机器学习的降维方法,结合K-Means聚类,从分子模拟轨迹中以低冗余方式提取多帧结构文件。
v. NequIP模型的超参数介绍和使用
vi. 复现Nat. Commun.文章结果,包括计算径向分布函数、键角分布等性质
vii. 使用wandb进行超参数调优与训练过程中各种信息的可视化分析
5. 第四天
a) 高效/高精度的基于ACE的等变模型
b) ACE方法,消息传递和等变框架的集大成者:MACE模型
c) 方法的完备性,效率和系列发展
d) MACE模型在多个领域的应用
e) 机器学习力场领域的ChatGPT模型
f) 有机分子体系的通用大模型:MACE-OFF23
g)几乎涵盖元素周期表所有元素的材料领域的通用大模型:MACE-MP0
h)其他大模型的简要介绍
i) 适用于大规模GPU并行框架的等变模型
i. 消息传递模型的不足
ii. NequIP团队在Nat. Commun.上的新作--Allegro模型的方法详解与比较
iii. SevenNet模型的介绍与比较
j) 实操部分
i. MACE模型和Allegro模型的超参数介绍和使用经验
ii. MACE模型与DeePMD模型的对比,包括精度,数据效率等
iii. Libtorch与LAMMPS软件的编译
iv. 机器学习力场领域的ChatGPT的使用与分析
v. 快速上手MACE-OFF23和MACE-MP0模型
vi. 对通用大模型进行微调与分析
vii.DPA-1和DPA-2的介绍与特点
"AI for Science"时代,机器学习分子动力学+机器学习第一性原理专题!https://mp.weixin.qq.com/s/icdBcJbKhOqtAymEpZds2A