向量数据库选型指南:Milvus vs Chroma vs Weaviate
一、为什么需要向量数据库?
RAG 架构让向量数据库成为 AI 基础设施核心。与传统数据库不同,向量数据库专为高维向量相似性搜索设计。
二、主流方案
Milvus
开源标杆,云原生架构。支持百亿级规模、多种索引类型、GPU 加速。劣势是部署复杂、小场景过重。
Chroma
轻量嵌入式,pip install 即用。与 LangChain 深度集成,适合原型验证。
Weaviate
内置向量化模块,GraphQL 查询,多租户支持,混合搜索。
Qdrant
Rust 实现,单机场景 QPS 远超同类。
Elasticsearch
新版内置向量检索,适合已有 ES 的团队。
三、选型建议
- 原型验证:Chroma
- 生产大容量:Milvus / Qdrant
- 已有 ES:Elasticsearch
- 需内置 Embedding:Weaviate
四、部署要点
- 常用向量维度:768(BGE)或 1536(OpenAI)
- HNSW 索引平衡性能和召回
- 生产环境开启 WAL
- 监控 p99 延迟控制在 100ms 内
本文为个人学习整理,欢迎交流讨论。