Milvus 基本原理

下面用面试能直接说、简短又完整的方式讲清楚 Milvus 基本原理(偏原理+架构+索引,Java/后端面试够用)。


一、一句话概括

Milvus 是分布式向量数据库 ,专门存高维向量(Embedding) ,核心是用ANN(近似最近邻)索引 解决"亿级向量中快速找相似 "的问题,支持向量+标量混合检索,适合 RAG、推荐、图像搜索等 AI 场景。


二、核心原理(三块:向量存储、索引、分布式架构)

1. 向量从哪来(Embedding)

文本/图片/音频 → 深度学习模型(如 BERT、CLIP)→ 高维浮点向量(如 768维、1536维),向量越近 = 内容越相似。

  • 相似度:余弦相似度 (文本常用)、欧氏距离(图像常用)。

2. 数据模型(类比 MySQL)

  • Collection(集合) ≈ 表,存向量+标量字段(如 id、content)
  • Partition(分区) ≈ 分区,按时间/业务分,缩小查询范围
  • Segment(分片) ≈ 数据块,分布式存储最小单元:
    • Growing Segment :内存中,正在写入,无索引
    • Sealed Segment :刷盘到对象存储(S3/MinIO),建索引,不可改

3. 索引原理(核心!解决慢查询)

直接全量算距离太慢(亿级向量 O(N)),Milvus 用ANN 索引 ,牺牲一点点精度换百倍速度

常用索引(面试必说)
  1. HNSW(Hierarchical Navigable Small World)

    • 分层图索引,向量之间连"邻居边"
    • 搜索:从顶层往下跳,快速定位最近邻居
    • 特点:查询快、召回高、内存占用大,默认首选
  2. IVF(Inverted File,倒排文件)

    • 用 K-means 把向量聚成 N 个"桶(聚类中心)"
    • 搜索:只查最相近的几个桶(nprobe),不扫全量
    • 变种:IVF_FLAT (原始向量)、IVF_PQ(向量压缩,省内存)
  3. 核心逻辑:先建索引 → 检索时走索引 → 只算少量候选向量距离 → 返回 TopK 相似结果。

4. 分布式架构(Milvus 2.x 核心)

分层解耦,弹性扩缩容,适合大数据量:

  • Proxy(接入层):无状态,接收请求、路由、负载均衡
  • Coord(协调层)
    • RootCoord:元数据、全局时间戳
    • DataCoord:数据管理、持久化
    • QueryCoord:查询调度
    • IndexCoord:索引管理
  • Worker(执行层)
    • DataNode:写入、Flush、Compaction(合并小文件)
    • QueryNode:向量检索、过滤、聚合
    • IndexNode:异步建索引
  • 存储层
    • WAL:RocksDB,保证写入可靠
    • 向量/索引:对象存储(S3/MinIO)
    • 元数据:etcd

三、查询流程(面试常问)

  1. 客户端发向量 + TopK + 过滤条件
  2. Proxy 路由到 QueryCoord
  3. QueryCoord 调度多个 QueryNode 并行搜索
  4. QueryNode:
    • 对 Sealed Segment:走 HNSW/IVF 索引
    • 对 Growing Segment:暴力扫描
    • 合并结果、过滤标量条件
  5. 汇总 TopK,返回客户端

四、面试背诵版(30秒说清楚)

Milvus 是分布式向量数据库,专门存储 Embedding 向量,核心用 HNSW/IVF 等 ANN 索引 ,把全量计算变成近似搜索 ,实现亿级向量毫秒级相似查询。采用 Proxy--Coord--Worker--存储四层架构,数据分 Segment 管理,支持向量与标量混合检索,常用于 RAG、推荐系统等 AI 场景。


相关推荐
Cosolar1 天前
万字详解:RAG 向量索引算法与向量数据库架构及实战
数据库·人工智能·算法·数据库架构·milvus
梵得儿SHI2 天前
(第四篇)Spring AI 架构设计与优化:真实生产环境复盘,从 100ms 到 10ms 的响应提速全流程
人工智能·缓存·性能优化·milvus·向量检索·rag·spring ai
Muyuan19983 天前
29.从 FAISS 到 Milvus:给我的 RAG Agent 项目加一层可替换的向量检索后端
fastapi·milvus·faiss
AIGC包拥它3 天前
RAG 项目实战进阶:基于 FastAPI + Vue3 前后端架构全面重构 LangChain 0.3 集成 Milvus 2.5 构建大模型智能应用
人工智能·python·重构·vue·fastapi·milvus·ai-native
My_Java_Life4 天前
windows中使用docker部署Milvus和Autt
windows·docker·milvus
霸道流氓气质5 天前
基于 Milvus Lite 的 Spring AI RAG 向量库实践方案与示例
人工智能·spring·milvus
隔窗听雨眠5 天前
基于Milvus混合检索与Java SpringBoot的全栈实现
milvus
毋语天5 天前
从零搭建 RAG 系统:Milvus 向量数据库 + 大模型完整实战指南
数据库·milvus
qq_283720056 天前
Milvus 向量数据库全链路优化实战教程
数据库·milvus