数据挖掘具体步骤
1、理解业务与数据
2、准备数据
数据清洗:
缺失值处理:
异常值:
数据标准化:
特征选择:
数据采样处理:
3、数据建模
分类问题:
聚类问题:
回归问题
关联分析
集成学习
Bagging(例如随机森林算法)
Boosting
Stacking
4、模型评估
淆矩阵与准确率指标
泛化能力评估
其他模型:
评估数据处理:
5、应用
模型保存:
模型优化:
Bagging(例如随机森林算法)
Boosting
Stacking
其他模型:
评估数据处理:
模型保存:
模型优化: