Apache Spark算法开发指导-特征选择

VectorSlicer

按照指定的特征值的列索引或者特征值的列名称,从特征集合中选择一批特征值作为新的特征集合。

Java代码示例:

运行Java代码:

RFormula

使用R语言的计算公式处理特征集合中的特征值以及标签值。

Java代码示例:

运行Java代码:

UnivariateFeatureSelector

利用卡方检验来评估分类特征与目标变量之间的相关性,从特征集合中选择一批最具预测能力的特征值作为新的特征集合。

Java代码示例:

运行Java代码:

VarianceThresholdSelector

使用方差以及指定界限值的方式,从特征集合中选择一批最优的特征值作为新的特征集合。

Java代码示例:

运行Java代码:

相关推荐
七夜zippoe10 天前
特征工程完整流程:从数据清洗到自动化特征生成的艺术
运维·自动化·特征工程·特征选择·featuretools
uesowys21 天前
Apache Spark算法开发指导-Logistic Regression
apache spark算法
uesowys23 天前
Apache Spark算法开发指导-Locality Sensitive Hashing
apache spark算法
源于花海1 个月前
迁移学习的第二类方法:特征选择
人工智能·机器学习·迁移学习·特征选择
deephub4 个月前
sklearn 特征选择实战:用 RFE 找到最优特征组合
人工智能·python·机器学习·sklearn·特征选择
Ai多利8 个月前
深度学习登上Nature子刊!特征选择创新思路
人工智能·算法·计算机视觉·多模态·特征选择
QBoson8 个月前
量子计算+AI:特征选择与神经网络优化创新应用
人工智能·神经网络·量子计算·图像分类·特征选择·“五岳杯”量子计算挑战赛·相干光量子计算机
小桥流水---人工智能10 个月前
ReliefF 的原理
特征选择·relieff
万事可爱^1 年前
特征选择方法
人工智能·学习·机器学习·监督学习·特征选择