下面用面试能直接说、简短又完整的方式讲清楚 Milvus 基本原理(偏原理+架构+索引,Java/后端面试够用)。
一、一句话概括
Milvus 是分布式向量数据库 ,专门存高维向量(Embedding) ,核心是用ANN(近似最近邻)索引 解决"亿级向量中快速找相似 "的问题,支持向量+标量混合检索,适合 RAG、推荐、图像搜索等 AI 场景。
二、核心原理(三块:向量存储、索引、分布式架构)
1. 向量从哪来(Embedding)
文本/图片/音频 → 深度学习模型(如 BERT、CLIP)→ 高维浮点向量(如 768维、1536维),向量越近 = 内容越相似。
- 相似度:余弦相似度 (文本常用)、欧氏距离(图像常用)。
2. 数据模型(类比 MySQL)
- Collection(集合) ≈ 表,存向量+标量字段(如 id、content)
- Partition(分区) ≈ 分区,按时间/业务分,缩小查询范围
- Segment(分片) ≈ 数据块,分布式存储最小单元:
- Growing Segment :内存中,正在写入,无索引
- Sealed Segment :刷盘到对象存储(S3/MinIO),建索引,不可改
3. 索引原理(核心!解决慢查询)
直接全量算距离太慢(亿级向量 O(N)),Milvus 用ANN 索引 ,牺牲一点点精度换百倍速度。
常用索引(面试必说)
-
HNSW(Hierarchical Navigable Small World)
- 分层图索引,向量之间连"邻居边"
- 搜索:从顶层往下跳,快速定位最近邻居
- 特点:查询快、召回高、内存占用大,默认首选
-
IVF(Inverted File,倒排文件)
- 用 K-means 把向量聚成 N 个"桶(聚类中心)"
- 搜索:只查最相近的几个桶(nprobe),不扫全量
- 变种:IVF_FLAT (原始向量)、IVF_PQ(向量压缩,省内存)
-
核心逻辑:先建索引 → 检索时走索引 → 只算少量候选向量距离 → 返回 TopK 相似结果。
4. 分布式架构(Milvus 2.x 核心)
分层解耦,弹性扩缩容,适合大数据量:
- Proxy(接入层):无状态,接收请求、路由、负载均衡
- Coord(协调层) :
- RootCoord:元数据、全局时间戳
- DataCoord:数据管理、持久化
- QueryCoord:查询调度
- IndexCoord:索引管理
- Worker(执行层) :
- DataNode:写入、Flush、Compaction(合并小文件)
- QueryNode:向量检索、过滤、聚合
- IndexNode:异步建索引
- 存储层 :
- WAL:RocksDB,保证写入可靠
- 向量/索引:对象存储(S3/MinIO)
- 元数据:etcd
三、查询流程(面试常问)
- 客户端发向量 + TopK + 过滤条件
- Proxy 路由到 QueryCoord
- QueryCoord 调度多个 QueryNode 并行搜索
- QueryNode:
- 对 Sealed Segment:走 HNSW/IVF 索引
- 对 Growing Segment:暴力扫描
- 合并结果、过滤标量条件
- 汇总 TopK,返回客户端
四、面试背诵版(30秒说清楚)
Milvus 是分布式向量数据库,专门存储 Embedding 向量,核心用 HNSW/IVF 等 ANN 索引 ,把全量计算变成近似搜索 ,实现亿级向量毫秒级相似查询。采用 Proxy--Coord--Worker--存储四层架构,数据分 Segment 管理,支持向量与标量混合检索,常用于 RAG、推荐系统等 AI 场景。