向量数据库FAISS之六:如何让FAISS更快

1.速度与精度指标参数

1.选择索引家族

2.选择索引参数

通过 faiss.index_factory() 调用实例化索引是很常见的。但这种实例化方式将索引参数设置为安全值,同时存在许多与速度相关的参数。许多 Faiss 组件可以利用:

  • 编码时使用的迭代算法;迭代次数越多,召回率就越高
    • HNSW: efConstruction
    • ResidualQuantizer: niter_codebook_refine
    • LocalSearchQuantizer: encode_ils_iters, icm_iters, train_iters, encode_ils_iters (for vector codecs)
  • 启发式方法限制训练或搜索过程中考虑的可能候选者的数量,例如 束搜索。评估的候选越多,召回率就越高。
    • IndexBinaryIVF: nprobe, max_codes
    • IndexIVF: nprobe, max_codes
    • ResidualQuantizer: max_beam_size
    • HNSW: efSearch
  • 其他可选版本,例如基于 LUT 的近似值;他们允许以速度换取准确性
    • IndexIVFPQ: do_polysemous_training, polysemous_ht, use_precomputed_table
    • IndexIVFPQFastScan: use_precomputed_table
    • IndexPQ: do_polysemous_training, polysemous_ht, search_type
    • ResidualQuantizer: use_beam_LUT, approx_topk_mode, train_type
    • LocalSearchQuantizer: update_codebooks_with_double
  • 针对特定情况优化的计算,例如大批量 IVF 搜索。
  • 用于处理块输入数据的各种内部缓冲区;见下文。
  • 随机数生成器;这些用于确保结果可以重现。

在大多数情况下,默认索引参数应该工作得相当好。但强烈建议研究可用参数,以便在您的特定速度与精度与 RAM 情况下找到最佳点。

秘诀:研究所选 index 及其 subindexes 的可用参数。

3.K-均值聚类

K-means 聚类是 Faiss 内部经常使用的工具。默认情况下,faiss/Clustering.h 中的 k-means 实现使用 25 次迭代(niter 参数)和每个集群所需的输入数据集中最多 256 个样本(max_points_per_centroid 参数)。样本是随机选择的。

例如,默认的 PQx12 训练比 PQx10 训练慢约 4 倍,比 PQx8 训练慢约 16 倍,因为输入数据集中使用的样本数量比例较高。

基于 IVF 的索引默认使用 10 次 k 均值迭代(faiss/IndexIVF.h、faiss/IndexBinaryIVF.h、faiss/gpu/GpuIndexIVF.cu)。

秘诀:使用 k 均值聚类 nitermax_points_per_centroid 参数。

4.查询批次

Faiss 针对批量样本的处理进行了优化,而不是逐个处理样本。

在内部,Faiss 以比调用者执行并行化更有效的方式对批处理元素进行并行化。

秘诀:如果合适的话,尝试分批处理样本

5.PQ训练的train_shared训练模式

考虑对 PQ 使用 Train_shared 训练模式,该模式用于为所有子量化器训练单个码本,而不是为每个子量化器训练单独的码本。

这显着减少了 10 位或 12 位 PQ 的训练时间,但代价是准确性。

相关推荐
l1t9 小时前
DeepSeek总结的将 Rust Delta Kernel 集成到 ClickHouse
数据库·clickhouse·rust
qq_283720059 小时前
万字深度:Chroma 向量数据库全解析 — 核心原理、实战操作、性能优化与工程最佳实践
数据库·性能优化
黄筱筱筱筱筱筱筱10 小时前
二进制包安装MySql服务
数据库
初心未改HD10 小时前
LLM应用开发之向量数据库详解
数据库·人工智能
键盘上的猫头鹰10 小时前
【从零学MySQL(三)】数据增删改(DML)及 SELECT 查询详解
数据库·mysql·数据分析
KaMeidebaby10 小时前
卡梅德生物技术快报|蛋白的过表达质粒构建与生信分析实验全流程复盘
前端·数据库·其他·百度·新浪微博
渣渣盟11 小时前
数据库之两段锁协议相关理论及应用
数据库·关系规范化·两段锁协议
LCG元11 小时前
Istio - 服务网格流量治理深度解析:灰度发布 / 故障注入配置实践
java·数据库·istio
SuniaWang11 小时前
《Agentx专栏》03-架构设计:AgentX的六层架构是如何生长出来的
java·数据库·redis·docker·ai·架构
键盘上的猫头鹰11 小时前
【从零学MySQL(二)】数据库基础操作、数据类型与约束(附Navicat演示)
数据库·mysql·数据分析·数据可视化