【Easy-VectorDB】Faiss入门与环境搭建笔记

bash 复制代码

# 安装CPU版本FAISS 
pip install faiss-cpu

验证安装

验证安装的代码部分

精准检索

IndexFlat2
- 基于L2（欧式距离）计算相似度，无近似误差，检索速度较慢，无需训练
- 适用场景：小规模数据（万级以下）、对精度极高的场景。
IndexFlatIP
- 基于内积（Inner Product）计算相似度，适用于归一化向量的余弦相似度检索
- 适用场景：文本语义检索（向量已归一化）、特征匹配

近似检索

IndexIVFFlat
- 基于倒排文件（Inverted File）结构，需先训练聚类中心，检索速度快，精度可调节。
- 适用场景：中大规模数据（百万级）、平衡速度与精度的场景。
IndexIVFPQ
- 在IndexIVF基础上添加乘积量化（PQ）压缩，大幅减少内存占用，支持十亿级数据。
- 适用场景：超大规模数据（十亿级）、内存有限的场景。
IndexHNSWFlat
- 基于层次化近似最近邻（HNSW）算法，检索速度极快，内存占用较高。
- 适用场景：对检索延迟要求极高的实时场景。

数据类型：FAISS仅支持32位浮点数（float32）作为向量数据类型，不支持其他格式。
数据结构：输入向量需为二维向量，形状为（num_vectors, dimension），其中num_vectors为向量数量，dimension为单个向量的维度（所有向量维度必须一致）。
数据来源适配：
- Numpy数组：可直接使用, add()方法添加。
- PyTorch/TensorFlow张量：需转换为Numpy数组后, 再转换为float32类型。
- Python列表：需先通过np.array()转换为Numpy数组，再处理类型和形状。

注意事项

自定义ID类型：必须为int64类型，否则会导致ID映射错误。
ID唯一性：添加的自定义ID需唯一，若重复添加相同ID，后续添加的向量会覆盖之前的向量。
索引操作兼容性：包装后的IndexIDMap支持基础索引的所有方法（如search、reset），但部分近似索引（如IndexIVFPQ）需先训练基础索引，再进行包装和添加ID。