技术栈
hnsw
阿里技术
13 天前
分布式
·
算法
·
方案
·
hnsw
·
向量检索
HNSW 分布式构建实践
作者:魏子敬随着大模型时代的到来,向量检索领域面临着前所未有的挑战。embedding 的维度和数量空前增长,这在工程上带来了极大的挑战。智能引擎事业部负责阿里巴巴搜推广及 AI 相关工程系统的设计和建设,我们在实际业务迭代与发展中遭遇了 embedding 维度和数量扩张带来的诸多问题,其中索引构建时间问题尤为突出。
scl、
9 个月前
学习
·
算法
·
elasticsearch
·
hnsw
·
anns
ElasticSearch学习篇11_ANNS之基于图的NSW、HNSW算法
往期博客ElasticSearch学习篇9_文本相似度计算方法现状以及基于改进的 Jaccard 算法代码实现与效果测评_elasticsearch 文字相似度实现方法-CSDN博客 根据论文对文本相似搜索现状做了一个简要总结,然后对论文提到的改进杰卡德算法做了实现,并结合业务场景测评,另外对其他两种改进杰卡德算法做了测评总结适用的业务场景。
晚点吧
1 年前
大数据
·
spark
·
ann
·
hnsw
·
向量检索
spark基于HNSW向量检索
参考文档:https://talks.anghami.com/blazing-fast-approximate-nearest-neighbour-search-on-apache-spark-using-hnsw/ HNSW参数调优文档:https://github.com/nmslib/hnswlib/blob/master/ALGO_PARAMS.md