技术栈
基于模型的特征选择
FreedomLeo1
4 个月前
笔记
·
python
·
机器学习
·
scikit-learn
·
单变量统计
·
基于模型的特征选择
·
迭代特征选择
Python机器学习笔记(二十、自动化特征选择)
创建新特征的方法有很多种,我们在处理数据时可能会想要增大数据的维度,使其远大于原始特征的数量。但添加更多特征会使所有模型变得更加复杂,从而增大过拟合的可能性。在添加新特征或处理一般的高维数据集时,最好将特征的数量减少到只包含最有用的那些特征,并删除其余特征。这样会得到泛化能力更好、更简单的模型。