技术栈

基于模型的特征选择

FreedomLeo1
4 个月前
笔记·python·机器学习·scikit-learn·单变量统计·基于模型的特征选择·迭代特征选择
Python机器学习笔记(二十、自动化特征选择)创建新特征的方法有很多种,我们在处理数据时可能会想要增大数据的维度,使其远大于原始特征的数量。但添加更多特征会使所有模型变得更加复杂,从而增大过拟合的可能性。在添加新特征或处理一般的高维数据集时,最好将特征的数量减少到只包含最有用的那些特征,并删除其余特征。这样会得到泛化能力更好、更简单的模型。