技术栈
apache spark算法
uesowys
8 天前
apache spark算法
Apache Spark算法开发指导-Logistic Regression
逻辑回归(Logistic Regression)是一种强大的数据统计分析方法,专门用于处理分类问题,例如,二分类问题,它的核心思想是通过一个逻辑函数(Sigmoid函数),将线性回归的输出映射到0和1之间,从而预测样本属于某一类的概率。
uesowys
9 天前
apache spark算法
Apache Spark算法开发指导-Locality Sensitive Hashing
Locality Sensitive Hashing哈希算法与传统哈希算法的区别是,传统哈希算法的作用是将数据均匀地分散到不同的数据桶,以减少数据的冲突,而Locality Sensitive Hashing哈希算法的作用是将相似的数据集中到相同的数据桶,通过计算最近距离的方式快速检索相似的数据。
uesowys
10 天前
特征选择
·
apache spark算法
Apache Spark算法开发指导-特征选择
VectorSlicer按照指定的特征值的列索引或者特征值的列名称,从特征集合中选择一批特征值作为新的特征集合。
我是有底线的