1.常见向量数据库
| 名称 | 类型 | 开源协议 | 分布式 | 核心索引算法 | 相似度度量 | 亮点 | 典型场景 |
|---|---|---|---|---|---|---|---|
| Milvus | 开源 + 托管云(Zilliz Cloud) | Apache 2.0 | ✅ 原生支持 | HNSW, IVF, ANNOY, DiskANN | L2, IP, 余弦 | 云原生架构,生态完善(LangChain/LlamaIndex 深度集成),支持标量过滤 | 大规模生产环境、高并发检索 |
| Qdrant | 开源 + 托管云 | Apache 2.0 | ✅(集群版) | HNSW + 量化 | 余弦, L2, 点积 | Rust 高性能,过滤语法灵活(类似 SQL),gRPC/HTTP 双协议 | 需要复杂过滤的实时搜索 |
| Weaviate | 开源 + 托管云 | BSD-3 | ✅ | HNSW | 余弦, L2, 点积 | 混合搜索(向量+关键词+Bm25),内置嵌入模型,GraphQL API | 语义+关键词融合搜索场景 |
| Chroma | 开源(轻量级) | Apache 2.0 | ❌(单机为主) | HNSW(hnswlib) | L2, 余弦 | 极简易用,Python/JS 友好,LangChain 默认集成 | 原型开发、小规模测试、教学 |
| Pinecone | 全托管商业 | 闭源 | ✅(自动扩缩容) | 专有优化 | 余弦, L2, 点积 | 零运维,Serverless 架构,自动索引优化 | 无运维团队、快速上线项目 |
| pgvector | PostgreSQL 扩展 | PostgreSQL 许可 | 依赖 PG 集群 | IVFFlat, HNSW(PG ≥16) | L2, 余弦, 内积 | 无缝嵌入现有 PG 业务,ACID 事务支持 | 已有 PostgreSQL、需向量+结构化数据联合查询 |
| LanceDB | 开源(嵌入式) | Apache 2.0 | ❌(单机) | IVF, HNSW | L2, 余弦 | 基于 Apache Arrow,支持本地/云存储,Python/Rust | 边缘设备、Notebook 快速实验 |
| FAISS | ANN 库(非数据库) | MIT | ❌ | 多种(HNSW, PQ 等) | 多种 | Meta 出品,算法丰富,高性能 | 需自研存储层、研究/定制化场景 |
- 云服务:Google Vertex AI Vector Search、AWS OpenSearch Serverless(向量)、Azure Cognitive Search(向量插件)------适合深度绑定云厂商的团队。
- 传统数据库扩展:RedisSearch(Redis 模块,需要新一些版本)、Elasticsearch/OpenSearch(k-NN 插件)------适合已有技术栈且向量需求较轻。
1.数据规模与运维能力
a.小规模/实验:Chroma、LanceDB。可以作为嵌入,适合本地测试
b.大规模/生产:Milvus、Qdrant(自建)或 Pinecone(免运维)
c.已有 PostgreSQL:优先评估 pgvector
2.功能需求
a.需混合搜索(关键词+向量):Weaviate
b.需复杂过滤:Qdrant、Milvus
c.需事务/结构化查询:pgvector
3.生态与集成
LangChain/LlamaIndex 用户:Milvus、Chroma、Weaviate 支持完善
云厂商绑定:考虑对应云服务(如 Vertex AI)
2.ai常见使用情况
大多数在langchain和langchain4j场景有集成,方便使用。详情见:https://github.com/langchain4j/langchain4j-examples