向量数据库Milvus的基础概念

一、集合、分区、数据段

复制代码
一个集合可包含多个分区,一个分区可包含多个Segment;

分区:相当于给知识库按「业务线」分文件夹(如 "产品部""技术部""销售部"),检索 "产品部文档" 时,只需要打开 "产品部" 文件夹,不用遍历整个知识库,效率更高;

Segment:相当于每个文件夹里的 "文档文件",

数据先写入 Partition,再由 Milvus 自动封装成 Segment;
检索时:先指定 Partition 缩小范围 → 加载对应 Partition 的 Segment 到内存 → 对 Segment 内数据做向量检索。

二、分区需要指定、segment不需要

组件 查找方式 是否需要代码配置 关键说明
Segment 完全自动 无需配置 Milvus 会根据数据分布、检索条件自动定位并检索目标 Segment(包括内存 / 磁盘中的 Segment),用户无需感知 Segment 的存在
分区(Partition) 默认全量检索所有分区;指定分区需手动配置 需要(指定分区时) 1. 不配置:检索时扫描 Collection 下所有分区的 Segment;2. 配置参数:仅扫描指定分区,大幅提升检索效率

三、集合的状态

复制代码
集合的状态

-必须先加载load集合到内存才能使用
-数据存储在磁盘上,但是搜索和索引需要在内存中进行
-加载操作就是将磁盘数据读取到内存

四、集合的生命周期

复制代码
集合的生命周期
-已创建但未加载,数据在磁盘中,不占用内存
-已加载,数据在内存中,可以进行所有的操作,占用内存资源
-已释放,集合数据从内存中释放,回到未加载状态

五、索引

索引类型 适用数据规模 核心优势 典型场景
IVF_FLAT 中小规模(百万级) 内存占用低,构建速度快 内存有限、需平衡速度与精度的场景
IVF_PQ 大规模(亿级) 内存占用仅为IVF_FLAT的1/4 内存受限的大规模数据集
HNSW 中大规模(百万~十亿级) 查询速度极快,支持高维数据 实时推荐、语义搜索等高并发场景
HNSW_SQ 大规模(十亿级) 内存占用比HNSW低50% 内存敏感的高维数据场景

六、一致性

一致性级别 核心说明 适用场景 性能 / 延迟 数据可见性
Strong(强一致) 读操作能看到所有已成功提交的写操作结果,读写严格按顺序执行 金融交易、核心业务数据检索 低 / 高延迟 写入后立即可见,无数据不一致
Bounded Staleness(有界过期) 读操作能看到「T 时间前 / 最多 N 版本前」的写操作结果,平衡一致性与性能 电商商品检索、日志分析 中 / 中延迟 可见性有可控延迟(如 1 秒),避免脏读
Session(会话一致) 同一客户端会话内,读操作能看到该会话提交的所有写操作结果,跨会话无保证 单用户知识库问答、个人操作 中 / 低延迟 会话内数据一致,跨会话可能延迟
Eventually(最终一致) 无严格时间 / 版本限制,写操作最终会被所有读操作看到(通常秒级) 非核心数据检索、批量数据导入 高 / 低延迟 写入后可能延迟可见(秒级),性能最优

七、服务节点

节点类型 核心作用 关键说明
Root Coord(根协调器) 集群总控核心,管理元数据、分配资源、调度全局任务(如创建 Collection) 集群的 "大脑",负责全局决策
Proxy(代理节点) 接收客户端请求,路由到对应节点,适配一致性级别,返回结果 客户端与集群的 "网关",无状态
Query Coord(查询协调器) 管理 Query Node,调度检索任务,聚合检索结果 检索任务的 "调度员"
Query Node(查询节点) 执行向量相似度检索、标量过滤,加载数据到内存,返回检索结果 检索功能的 "执行者",性能核心
Index Coord(索引协调器) 管理 Index Node,调度索引构建任务,维护索引元数据 索引任务的 "调度员"
Index Node(索引节点) 为向量数据构建索引(如 IVF_FLAT、HNSW),提升检索效率 索引构建的 "执行者"
Data Coord(数据协调器) 管理 Data Node,分片管理、数据均衡,维护数据生命周期 数据存储的 "调度员"
Data Node(数据节点) 处理数据写入 / 删除,将数据持久化到存储介质(如 MinIO),生成日志 数据写入的 "执行者"
Etcd 存储集群元数据(节点信息、Collection 配置),实现节点间状态同步 集群的 "配置中心",依赖外部部署
相关推荐
学Linux的语莫1 天前
Milvus向量数据库的基础连接操作
数据库·milvus
Coder_Boy_2 天前
开源向量数据库比较(Chroma、Milvus、Faiss、Weaviate)
数据库·人工智能·spring boot·开源·milvus
咕噜企业分发小米2 天前
阿里云Milvus的HNSW索引如何优化?
阿里云·云计算·milvus
咕噜企业分发小米2 天前
阿里云Milvus支持哪些向量检索算法?
算法·机器学习·milvus
lusasky2 天前
Milvus为什么需要MinIO
milvus
学Linux的语莫2 天前
向量数据库milvus的搭建部署
milvus
咕噜企业分发小米3 天前
阿里云Milvus如何评估向量检索效果?
阿里云·云计算·milvus
我在北国不背锅3 天前
Milvus向量数据库索引说明
数据库·milvus
杨二K4 天前
Milvus性能权衡
数据库·人工智能·milvus