技术栈

hnsw

阿里技术
5 个月前
分布式·算法·方案·hnsw·向量检索
HNSW 分布式构建实践作者:魏子敬随着大模型时代的到来,向量检索领域面临着前所未有的挑战。embedding 的维度和数量空前增长,这在工程上带来了极大的挑战。智能引擎事业部负责阿里巴巴搜推广及 AI 相关工程系统的设计和建设,我们在实际业务迭代与发展中遭遇了 embedding 维度和数量扩张带来的诸多问题,其中索引构建时间问题尤为突出。
scl、
1 年前
学习·算法·elasticsearch·hnsw·anns
ElasticSearch学习篇11_ANNS之基于图的NSW、HNSW算法往期博客ElasticSearch学习篇9_文本相似度计算方法现状以及基于改进的 Jaccard 算法代码实现与效果测评_elasticsearch 文字相似度实现方法-CSDN博客 根据论文对文本相似搜索现状做了一个简要总结,然后对论文提到的改进杰卡德算法做了实现,并结合业务场景测评,另外对其他两种改进杰卡德算法做了测评总结适用的业务场景。
晚点吧
2 年前
大数据·spark·ann·hnsw·向量检索
spark基于HNSW向量检索参考文档:https://talks.anghami.com/blazing-fast-approximate-nearest-neighbour-search-on-apache-spark-using-hnsw/ HNSW参数调优文档:https://github.com/nmslib/hnswlib/blob/master/ALGO_PARAMS.md