Milvus向量数据库的操作（基于Langchain）

学Linux的语莫2025-12-29 19:12

一、Langchain中初始化一个Milvus对象

复制代码

from langchain_milvus import Milvus
# 基础配置
MILVUS_CONFIG = {
    "connection_args": {
        "uri": "http://192.168.88.14:19530",
        "db_name": "dbuser"  # 关键：指定要连接的数据库名
    },
    "collection_name": "LangChainCollection"
}
# 初始化对象
vector_store = Milvus(
    collection_name=MILVUS_CONFIG["collection_name"],
    embedding_function=llm_embeddings,
    connection_args=MILVUS_CONFIG["connection_args"],
)
# 添加文档内容
# vector_store.add_documents(documents=split_documents)

二、自定义向量数据库的存储字段

复制代码

# 初始化Milvus向量存储（框架自动加载集合）
vector_store = Milvus(

    embedding_function=llm_embeddings,
    connection_args={"uri": "http://192.168.88.14:19530"},
    collection_name=collection_name,

    # 基础字段映射（原有4个字段）
    text_field="content",       # page_content → content
    vector_field="ve",          # 向量 → ve
    primary_field="id",         # 主键 → id

    # 扩展映射：新增time字段 + 原有su字段
    metadata_fields={
        "source": "su",         # metadata["source"] → su字段
        "doc_time": "time"      # metadata["doc_time"] → time字段（核心新增）
    },
    auto_create_collection=False  # 禁用自动创建，使用已有集合
)

三、在langchain中的默认概念

复制代码

（1）文本类型使用Document对象和数据库交互

（2）库：连接默认default库

（3）集合(表)：框架默认创建的集合为LangChainCollection

（4）字段：默认的字段为：text，pk（auto_id=False），vector，source