技术栈
极致梯度提升分类
doll ~CJ
5 个月前
scikit-learn
·
集成学习
·
xgboost
·
传统机器学习
·
决策树分类
·
随机森林分类
·
极致梯度提升分类
基于scikit-learn的机器学习分类任务实践——集成学习
传统机器学习是指,利用线性代数、数理统计与优化算法等数学方式从设计获取的数据集中构建预测学习器,进而对未知数据分类或回归。其主要流程大致可分为七个部分,依次为设计获取数据特征集(特征构造和特征提取)、探索性地对数据质量分析评价、数据预处理、数据集划分、机器学习算法建模(学习器选择、特征筛选与参数调优)、任务选择(分类或回归)和精度评价与泛化性评估,设计获取数据特征集和机器学习算法建模是机器学习最为重要且关键的部分。