milvus笔记、常用表结构

文章目录

通用表结构

通用表结构-简单描述

这个是给大模型的话术,它直接就能生成出来:

bash 复制代码
v_common # 表名
id # id int64
vector # 向量 float32 1536维
content # 内容 varchar(1024)
category # 分类 varchar(256)
通用表结构-代码创建表结构
python 复制代码
from custom_milvus_client import client


from pymilvus import MilvusClient, DataType

# 假设 client 已经通过 custom_milvus_client 初始化并连接
# from custom_milvus_client import client

collection_name = "v_common"

# 1. 定义 Schema
# auto_id=True: 表示 id 由 Milvus 自动生成,插入数据时无需传 id
# enable_dynamic_field=False: 强制严格模式,只能插入定义的字段
schema = client.create_schema(auto_id=True, enable_dynamic_field=False)

# 2. 添加字段
# --- 主键 ---
schema.add_field(field_name="id", datatype=DataType.INT64, is_primary=True)

# --- 向量字段 (1536维) ---
schema.add_field(field_name="vector", datatype=DataType.FLOAT_VECTOR, dim=1536)

# --- 内容字段 (Varchar 1024) ---
schema.add_field(field_name="content", datatype=DataType.VARCHAR, max_length=1024)

# --- 分类字段 (Varchar 256) ---
schema.add_field(field_name="category", datatype=DataType.VARCHAR, max_length=256)

# 3. 定义索引参数
# 使用 HNSW 索引(高性能) + COSINE 距离(适合文本向量)
index_params = client.prepare_index_params()
index_params.add_index(
    field_name="vector",
    index_type="HNSW",
    metric_type="COSINE",
    params={"M": 16, "efConstruction": 256}
)

# 4. 创建集合
# 如果集合已存在,先删除(开发环境常用,生产环境请慎用)
if client.has_collection(collection_name):
    client.drop_collection(collection_name)
    print(f"⚠️ 集合 '{collection_name}' 已存在,已删除并重建。")

client.create_collection(
    collection_name=collection_name,
    schema=schema,
    index_params=index_params,
    consistency_level="Strong"  # 强一致性,确保写入后立即能被搜到
)

print(f"✅ 集合 '{collection_name}' 创建成功!")
相关推荐
Old Uncle Tom4 分钟前
OpenClaw 记忆系统 -- 记忆预加载
java·数据结构·算法·agent
会编程的土豆14 分钟前
洛谷题单入门1 顺序结构
数据结构·算法·golang
生信碱移16 分钟前
PACells:这个方法可以鉴定疾病/预后相关的重要细胞亚群,作者提供的代码流程可以学习起来了,甚至兼容转录组与 ATAC 两种数据类型!
人工智能·学习·算法·机器学习·数据挖掘·数据分析·r语言
智者知已应修善业37 分钟前
【51单片机中的打飞机设计】2023-8-25
c++·经验分享·笔记·算法·51单片机
智者知已应修善业3 小时前
【51单片机按键调节占空比3位数码管显示】2023-8-24
c++·经验分享·笔记·算法·51单片机
JasmineX-13 小时前
数据结构(笔记)——双向链表
c语言·数据结构·笔记·链表
.5484 小时前
## Sorting(排序算法)
python·算法·排序算法
wuweijianlove4 小时前
算法的平均复杂度建模与性能回归分析的技术7
算法·数据挖掘·回归
子琦啊4 小时前
【算法复习】字符串 | 两个底层直觉,吃透高频题
linux·运维·算法
程序猿乐锅4 小时前
【Tilas|第三篇】多表SQL语句
数据库·经验分享·笔记·学习·mysql