机器学习催化剂设计专题学习

https://mp.weixin.qq.com/s/cCshpONi2eWfYzSv2XC76A，有需要的老师，可点击链接即可了解详情。

第一天：

第一天上午

理论内容：

1.机器学习概述

2.材料与化学中的常见机器学习方法

3.应用前沿

实操内容：

1.Python基础：变量和数据类型，列表，字典，if语句，循环，函数

2.Python科学数据处理：NumPy，Pandas，Matplotlib

案例一：随着AI For Science时代的到来，机器学习以优异的速度迅速扩展到各个领域。本次培训详细讲解从下载到安装，再到环境配置全流程。无论是数据科学新手还是进阶学习者，都能借此掌握 Anaconda 操作要点，轻松搭建编程环境，为后续 Python 开发、数据分析等工作筑牢基础。

第一天下午

理论内容：

1.sklearn基础介绍

2.线性回归原理和正则化

实操内容：

线性回归方法的实现与初步应用
L1和L2正则项的使用方法
线性回归用于HER催化剂的筛选
符号回归用于发现金属催化氧化载体中金属-载体相互作用

案例二：金属-载体相互作用是多相催化中最重要的支柱之一，但由于其复杂的界面，建立一个基本的理论一直具有挑战性。基于实验数据、可解释的机器学习、理论推导和第一性原理模拟，以建立了基于金属-金属和金属-氧相互作用的金属-氧化物相互作用的一般理论（符号回归）。

第二天上午

理论内容：

逻辑回归

1.1原理

1.2 使用方法

K近邻方法（KNN）

2.1 KNN分类原理

2.2 KNN分类应用

神经网络方法的原理

3.1 神经网络原理

3.2神经网络分类

3.3神经网络回归

实操内容：

1.逻辑回归的实现与初步应用

2.KNN方法的实现与初步应用

3.神经网络实现

案例三：铜基合金催化剂因其良好的选择性和过电位低等特点，在二氧化碳还原反应（CO2RR）领域得到了广泛的应用。为了实现对CO2RR合金催化剂的高效探索，通过实施严格的特征选择过程，将特征空间的维数从13维降至5维，ML模型成功快速预测了CO2RR过程中关键中间体（HCOO、CO和COOH）的吸附能。

第二天下午

项目实操：

1.基于少特征模型的机器学习预测二氧化碳还原电催化剂

2.基于文本数据信息预测甲醇转化率

这两个实操项目同时穿插讲解如下内容

A1 机器学习材料与化学应用的典型步骤

A1.1 数据采集和清洗

A1.2 特征选择和模型选择

A1.3 模型训练和测试

A1.4 模型性能评估和优化

案例四：结构化材料合成路线对于化学家进行实验和现代应用（如机器学习材料设计）至关重要。近年来，化学文献呈指数级增长，人工提取已发表文献耗时耗力。本研究的重点是开发一种从化学文献中提取pd基催化剂合成路线的自动化方法。并利用合成路线的结构化数据来训练机器学习模型并预测甲烷转化率的性能。

第三天上午

理论内容：

1．决策树

1.1决策树的原理

1.2决策树分类

2．集成学习方法

2.1集成学习原理

2.2随机森林

2.3Bosting方法

3.朴素贝叶斯概率

3.1原理解析

3.2 模型应用

支持向量机

4.1分类原理

4.2核函数

实操内容

1.决策树的实现和应用

2.随机森林的实现和应用

3.朴素贝叶斯的实现和应用

4.支持向量机的实现和应用

案例五：集成学习通过多层模型组合与融合，在提升模型性能方面极具优势。在数据挖掘中，面对海量且复杂的数据，单一模型往往难以全面捕捉数据特征。集成学习将弱学习器的性能结合，先由各基础模型从不同角度挖掘数据，再通过加权等方式融合结果，能更全面地剖析机器学习结果。

第三天下午

项目实操

1.机器学习加速设计ORR和OER双功能电催化剂

2.二元合金中双官能团氧电催化剂的有效机器学习模型设计

3.SHAP机器学习可解释性分析

这两个实操项目同时穿插讲解如下内容

A1 模型性能的评估方法

A1.1 交叉验证：评估估计器的性能

A1.2 分类性能评估

A1.3 回归性能评估

案例六：氧还原反应（ORR）和析氧反应（OER）是清洁能源转化的关键。近年来，双金属位催化剂（DMSCs）因其原子利用率高、稳定性强、催化性能好而受到广泛关注。本研究采用密度泛函理论（DFT）和机器学习（ML）相结合的先进方法，研究吸附物在数百种潜在催化剂上的吸附自由能，来筛选对ORR和OER具有高活性的催化剂。

第四天上午

理论内容：

无监督学习

2.1 什么是无监督学习

2.2 无监督算法------聚类

2.3 无监督算法------降维

材料与化学数据的特征工程

2.1分子结构表示

2.2 独热编码

实操内容：

鸢尾花数据集用于聚类实现和应用

T-SNE实现和应用

PCA的实现和应用

层次聚类的实现和应用

K-means聚类的实现和应用

案例七：无监督学习是从无标签数据中挖掘模式与结构，t-SNE作为其重要降维工具，专注于保留高维数据点间局部结构。课程将深入讲解t-SNE核心原理，如通过概率分布衡量点间相似性，以优化KL散度实现降维，展示其在高维数据可视化中的强大作用。还会进行代码实操，涵盖数据加载、参数调优、降维及可视化等环节，让学员熟练掌握t-SNE在不同场景的应用，助力探索数据潜在结构与模式。

第四天下午

项目实操

理论内容：

1.深度学习理论基础

2.DNN、RNN、CNN、LSTM及Transformer基础框架介绍

实操内容

torch基础练习
应用RNN、CNN、LSTM模型筛选光催化剂

案例八：近年来，结合高通量（HT）和机器学习（ML）的策略以加速有前途的新材料的发现已经引起了人们的极大关注。因此，可以设计一种直观的方法，通过数据库并结合深度学习模型，并将它们与HT方法耦合，以寻找高效的2D水分解光催化剂。

第五天上午

理论内容：

1.图深度学习理论基础

2.图深度学习应用实例OC20、OC22电催化剂开发挑战（ACS Catalysis）

实操内容：

图结构构建及可视化
PyTorch Geometric基础介绍

案例九：近年来，在晶体性能预测领域，图神经网络（graph neural network，GNN）模型取得了长足的发展。GNN模型可以有效地从晶体结构中捕捉高维晶体特征，从而在性能预测中获得最佳性能。指导学员搭建图深度学习开发环境，以顺利构建图结构，并进行机器学习训练。

第五天下午

项目实操

1.图神经网络模型基本概述及CGCNN代码深度解读应用

2.基于图论构建反应网络用于NO电还原反应研究

3.Transformer辅助水氧化制备过氧化氢(WOR)及可解释分析

案例十：氮氧化物排放严重影响我们的环境和人类健康。光催化脱硝（deNOx）因其低成本、无污染而备受关注，但实际生产中产生的是不需要的亚硝酸盐和硝酸盐，而不是无害的氮气。揭示活性位点和光催化机理对改进工艺具有重要意义。本次课程以指导学员依据反应中间体，建立图反应网络结构以揭示反应机理。