向量数据库Milvus的基础概念

一、集合、分区、数据段

复制代码
一个集合可包含多个分区,一个分区可包含多个Segment;

分区:相当于给知识库按「业务线」分文件夹(如 "产品部""技术部""销售部"),检索 "产品部文档" 时,只需要打开 "产品部" 文件夹,不用遍历整个知识库,效率更高;

Segment:相当于每个文件夹里的 "文档文件",

数据先写入 Partition,再由 Milvus 自动封装成 Segment;
检索时:先指定 Partition 缩小范围 → 加载对应 Partition 的 Segment 到内存 → 对 Segment 内数据做向量检索。

二、分区需要指定、segment不需要

组件 查找方式 是否需要代码配置 关键说明
Segment 完全自动 无需配置 Milvus 会根据数据分布、检索条件自动定位并检索目标 Segment(包括内存 / 磁盘中的 Segment),用户无需感知 Segment 的存在
分区(Partition) 默认全量检索所有分区;指定分区需手动配置 需要(指定分区时) 1. 不配置:检索时扫描 Collection 下所有分区的 Segment;2. 配置参数:仅扫描指定分区,大幅提升检索效率

三、集合的状态

复制代码
集合的状态

-必须先加载load集合到内存才能使用
-数据存储在磁盘上,但是搜索和索引需要在内存中进行
-加载操作就是将磁盘数据读取到内存

四、集合的生命周期

复制代码
集合的生命周期
-已创建但未加载,数据在磁盘中,不占用内存
-已加载,数据在内存中,可以进行所有的操作,占用内存资源
-已释放,集合数据从内存中释放,回到未加载状态

五、索引

索引类型 适用数据规模 核心优势 典型场景
IVF_FLAT 中小规模(百万级) 内存占用低,构建速度快 内存有限、需平衡速度与精度的场景
IVF_PQ 大规模(亿级) 内存占用仅为IVF_FLAT的1/4 内存受限的大规模数据集
HNSW 中大规模(百万~十亿级) 查询速度极快,支持高维数据 实时推荐、语义搜索等高并发场景
HNSW_SQ 大规模(十亿级) 内存占用比HNSW低50% 内存敏感的高维数据场景

六、一致性

一致性级别 核心说明 适用场景 性能 / 延迟 数据可见性
Strong(强一致) 读操作能看到所有已成功提交的写操作结果,读写严格按顺序执行 金融交易、核心业务数据检索 低 / 高延迟 写入后立即可见,无数据不一致
Bounded Staleness(有界过期) 读操作能看到「T 时间前 / 最多 N 版本前」的写操作结果,平衡一致性与性能 电商商品检索、日志分析 中 / 中延迟 可见性有可控延迟(如 1 秒),避免脏读
Session(会话一致) 同一客户端会话内,读操作能看到该会话提交的所有写操作结果,跨会话无保证 单用户知识库问答、个人操作 中 / 低延迟 会话内数据一致,跨会话可能延迟
Eventually(最终一致) 无严格时间 / 版本限制,写操作最终会被所有读操作看到(通常秒级) 非核心数据检索、批量数据导入 高 / 低延迟 写入后可能延迟可见(秒级),性能最优

七、服务节点

节点类型 核心作用 关键说明
Root Coord(根协调器) 集群总控核心,管理元数据、分配资源、调度全局任务(如创建 Collection) 集群的 "大脑",负责全局决策
Proxy(代理节点) 接收客户端请求,路由到对应节点,适配一致性级别,返回结果 客户端与集群的 "网关",无状态
Query Coord(查询协调器) 管理 Query Node,调度检索任务,聚合检索结果 检索任务的 "调度员"
Query Node(查询节点) 执行向量相似度检索、标量过滤,加载数据到内存,返回检索结果 检索功能的 "执行者",性能核心
Index Coord(索引协调器) 管理 Index Node,调度索引构建任务,维护索引元数据 索引任务的 "调度员"
Index Node(索引节点) 为向量数据构建索引(如 IVF_FLAT、HNSW),提升检索效率 索引构建的 "执行者"
Data Coord(数据协调器) 管理 Data Node,分片管理、数据均衡,维护数据生命周期 数据存储的 "调度员"
Data Node(数据节点) 处理数据写入 / 删除,将数据持久化到存储介质(如 MinIO),生成日志 数据写入的 "执行者"
Etcd 存储集群元数据(节点信息、Collection 配置),实现节点间状态同步 集群的 "配置中心",依赖外部部署
相关推荐
SuniaWang2 天前
《Agentx专栏》02-技术选型:预算有限时如何做出正确的技术决策
java·spring·架构·langchain·milvus·agenx·opl
Rick19935 天前
Milvus 基本原理
milvus
Cosolar5 天前
万字详解:RAG 向量索引算法与向量数据库架构及实战
数据库·人工智能·算法·数据库架构·milvus
梵得儿SHI6 天前
(第四篇)Spring AI 架构设计与优化:真实生产环境复盘,从 100ms 到 10ms 的响应提速全流程
人工智能·缓存·性能优化·milvus·向量检索·rag·spring ai
Muyuan19988 天前
29.从 FAISS 到 Milvus:给我的 RAG Agent 项目加一层可替换的向量检索后端
fastapi·milvus·faiss
AIGC包拥它8 天前
RAG 项目实战进阶:基于 FastAPI + Vue3 前后端架构全面重构 LangChain 0.3 集成 Milvus 2.5 构建大模型智能应用
人工智能·python·重构·vue·fastapi·milvus·ai-native
My_Java_Life8 天前
windows中使用docker部署Milvus和Autt
windows·docker·milvus
霸道流氓气质9 天前
基于 Milvus Lite 的 Spring AI RAG 向量库实践方案与示例
人工智能·spring·milvus
隔窗听雨眠9 天前
基于Milvus混合检索与Java SpringBoot的全栈实现
milvus
毋语天10 天前
从零搭建 RAG 系统:Milvus 向量数据库 + 大模型完整实战指南
数据库·milvus