技术栈
apache spark算法
uesowys
5 小时前
apache spark算法
Apache Spark算法开发指导-Locality Sensitive Hashing
Locality Sensitive Hashing哈希算法与传统哈希算法的区别是,传统哈希算法的作用是将数据均匀地分散到不同的数据桶,以减少数据的冲突,而Locality Sensitive Hashing哈希算法的作用是将相似的数据集中到相同的数据桶,通过计算最近距离的方式快速检索相似的数据。
uesowys
1 天前
特征选择
·
apache spark算法
Apache Spark算法开发指导-特征选择
VectorSlicer按照指定的特征值的列索引或者特征值的列名称,从特征集合中选择一批特征值作为新的特征集合。
我是有底线的