模块一:Python编程
Python编程入门
1、Python环境搭建
2、如何选择Python编辑器?
3、Python基础
4、常见的错误与程序调试
5、第三方模块的安装与使用
6、文件读写(I/O)
Python进阶与提高
1、Numpy模块库
2、Pandas模块库
3、Matplotlib基本图形绘制
4、图形样式的美化
5、图形的布局
6、高级图形绘制
7、坐标轴高阶应用
模块二:特征工程
数据清洗
1、描述性统计分析
2、数据标准化与归一化
3、数据异常值、缺失值处理
4、数据离散化及编码处理
5、手动生成新特征
变量降维
1、主成分分析(PCA)的基本原理
2、偏最小二乘(PLS)的基本原理
特征选择
1、常见的特征选择方法
群优化算法
1、遗传算法
2、遗传算法的Python代码实现
3、实践一:一元函数的寻优计算
4、实践二:离散变量的寻优计算(特征选择)
模块三:回归拟合模型
线性回归模型
1、一元线性回归模型与多元线性回归模型
2、岭回归模型
3、LASSO模型
4、Elastic Net模型
前向型神经网络
1、BP神经网络的基本原理
2、BP神经网络的Python代码实现
3、BP神经网络参数的优化
4、值得研究的若干问题
5、极限学习机(Extreme Learning Machine, ELM)的工作原理
模块四:分类识别模型
KNN、贝叶斯分类与支持向量机
1、KNN分类模型
2、朴素贝叶斯分类模型
3、SVM的工作原理
决策树、随机森林、LightGBM、XGBoost
1、决策树的工作原理
2、随机森林的工作原理
3、Bagging与Boosting的区别与联系
4、AdaBoost vs. Gradient Boosting的工作原理
- 常用的GBDT算法框架(XGBoost、LightGBM)
模块五:聚类分析算法
K均值、DBSCAN、层次聚类
1、K均值聚类算法的工作原理
2、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类算法的工作原理
层次聚类算法的工作原理
模块六:关联分析算法
关联规则协同过滤Apriori算法
1、关联规则算法的工作原理
2、协同过滤算法的工作原理
3、Apriori算法的工作原理