milvus元数据在etcd的存储解析

milvus元数据在etcd的存储解析

数据以key-value形式存在。

大致包含如下一些种类:

  • database
  • collection
  • field
  • partition
  • index
  • segment-index
  • resource_group
  • session

database

创建一个数据库会产生2个key,但value是相同的。

key规则:

  • 前缀/root-coord/database/db-info/{dbID}

  • 前缀/snapshots/root-coord/database/db-info/{dbID}_ts{时间戳}

默认数据库名为default,dbID为1。

ID和时间戳都是一串数字,由physicalTime+logicalTime组成。

创建一个名为testdb01的数据库,产生的2个key如下:

shell 复制代码
by-dev/meta/root-coord/database/db-info/444381061892856434

by-dev/meta/snapshots/root-coord/database/db-info/444381061892856434_ts444383983389376515

444381061892856434为dbid。这个ID可以进行tso解析。

value结构如下:

将此结构体使用protobuf序列化后存入到etcd,因此etcd存储的是二进制数据。

collection

创建一个collection会产生2个key,但value是相同的。

key规则:

  • 前缀/root-coord/database/collection-info/{dbID}/{collectionID}

  • 前缀/snapshots/root-coord/database/collection-info/{dbID}/{collectionID}_ts{时间戳}

可以反映出collection属于哪个DB。

在testdb01下创建一个名为testcol01的collection,产生如下2个key:

  • by-dev/meta/root-coord/database/collection-info/444381061892856434/444384207423931210

  • by-dev/meta/snapshots/root-coord/database/collection-info/444381061892856434/444384207423931210_ts444384251124908036

value结构如下:

将此结构体序列化后存入到etcd,因此etcd存储的是二进制数据。

field

创建collection的时候会创建field,一个field会产生2个key,但value是相同的。

key规则:

  • 前缀/root-coord/fields/{collectionID}/{fieldID}

  • 前缀/snapshots/root-coord/fields/{collectionID}/{fieldID}_ts{时间戳}

可以反映field属于哪个collection。虽然并未反应出属于哪个db,但是collectionID是唯一的,也可以通过collectionID判断出属于那个db。这样不同的db下面有相同名称的collection就可以区别了。

一个field就是一个字段。

创建一个名为testcol01的collection,包含2个field(hid和embedding)产生的key如下:

hid字段:

  • by-dev/meta/root-coord/fields/444384207423938951/100

  • by-dev/meta/snapshots/root-coord/fields/444384207423938951/100_ts444384154740064260

embedding字段:

  • by-dev/meta/root-coord/fields/444384207423938951/101

  • by-dev/meta/snapshots/root-coord/fields/444384207423938951/101_ts444384154740064260

value结构如下:

将此结构体序列化后存入到etcd,因此etcd存储的是二进制数据。

partition

创建一个分区会产生2个key,但value是相同的。

key规则:

  • 前缀/root-coord/partitions/{collectionID}/{partitionID}

  • 前缀/snapshots/root-coord/partitions/{collectionID}/{partitionID}_ts{时间戳}

可以反映partition属于哪个collection。

一个collection可以包含多个partition。

默认partition名为:_default。

可配置(milvus.yml):common.defaultPartitionName

在名为testcol01的collection下包含1个partition,产生如下2个key:

  • by-dev/meta/root-coord/partitions/444384963133177989/444384963133177990

  • by-dev/meta/snapshots/root-coord/partitions/444384963133177989/444384963133177990_ts444384154740064260

value结构如下:

将此结构体序列化后存入到etcd,因此etcd存储的是二进制数据。

index

创建index会产生2个类型的key。一个是index,一个是segment-index。

key规则:

  • 前缀/field-index/{collectionID}/{IndexID}

可以反映index属于哪个collection。Index的value可以反映索引建立在哪个field。

不能反映属于哪个partition、哪个segment。

创建一个名为idx_embedding的索引,产生1个类型的key如下:

  • by-dev/meta/field-index/444384207423931210/444425876914135276

value结构如下:

将此结构体序列化后存入到etcd,因此etcd存储的是二进制数据。

segment-index

创建index会产生2个类型的key。一个是index,一个是segment-index。

key规则:

  • 前缀/segment-index/{collectionID}/{partitionID}/{segmentID}/{buildID}

创建一个名为idx_embedding的索引,产生1个类型的key如下:

  • by-dev/meta/segment-index/444517122896489678/444517122896489679/444517122896489694/444521062292259541

value结构如下:

将此结构体序列化后存入到etcd,因此etcd存储的是二进制数据。

resource_group

资源组可以用来进行查询节点的物理隔离。

在多collection环境中,为每个资源组分配适当数量的查询节点,应用到collection中

key规则:

  • 前缀/queryCoord-ResourceGroup/{rgName}

创建一个名为rg的资源组,产生如下1个key:

  • by-dev/meta/queryCoord-ResourceGroup/rg

value结构如下:

将此结构体序列化后存入到etcd,因此etcd存储的是二进制数据。

相关推荐
明月醉窗台1 小时前
qt使用笔记二:main.cpp详解
数据库·笔记·qt
沉到海底去吧Go1 小时前
【图片自动识别改名】识别图片中的文字并批量改名的工具,根据文字对图片批量改名,基于QT和腾讯OCR识别的实现方案
数据库·qt·ocr·图片识别自动改名·图片区域识别改名·pdf识别改名
老纪的技术唠嗑局2 小时前
重剑无锋,大巧不工 —— OceanBase 中的 Nest Loop Join 使用技巧分享
数据库·sql
未来之窗软件服务2 小时前
JAVASCRIPT 前端数据库-V6--仙盟数据库架构-—-—仙盟创梦IDE
数据库·数据库架构·仙盟创梦ide·东方仙盟·东方仙盟数据库
一只爱撸猫的程序猿3 小时前
构建一个简单的智能文档问答系统实例
数据库·spring boot·aigc
nanzhuhe4 小时前
sql中group by使用场景
数据库·sql·数据挖掘
消失在人海中4 小时前
oracle sql 语句 优化方法
数据库·sql·oracle
Clang's Blog4 小时前
一键搭建 WordPress + MySQL + phpMyAdmin 环境(支持 PHP 版本选择 & 自定义配置)
数据库·mysql·php·wordpr
zzc9214 小时前
MATLAB仿真生成无线通信网络拓扑推理数据集
开发语言·网络·数据库·人工智能·python·深度学习·matlab
未来之窗软件服务4 小时前
JAVASCRIPT 前端数据库-V1--仙盟数据库架构-—-—仙盟创梦IDE
数据库·数据库架构·仙盟创梦ide·东方仙盟数据库