一、Langchain中初始化一个Milvus对象
from langchain_milvus import Milvus
# 基础配置
MILVUS_CONFIG = {
"connection_args": {
"uri": "http://192.168.88.14:19530",
"db_name": "dbuser" # 关键:指定要连接的数据库名
},
"collection_name": "LangChainCollection"
}
# 初始化对象
vector_store = Milvus(
collection_name=MILVUS_CONFIG["collection_name"],
embedding_function=llm_embeddings,
connection_args=MILVUS_CONFIG["connection_args"],
)
# 添加文档内容
# vector_store.add_documents(documents=split_documents)
二、自定义向量数据库的存储字段
# 初始化Milvus向量存储(框架自动加载集合)
vector_store = Milvus(
embedding_function=llm_embeddings,
connection_args={"uri": "http://192.168.88.14:19530"},
collection_name=collection_name,
# 基础字段映射(原有4个字段)
text_field="content", # page_content → content
vector_field="ve", # 向量 → ve
primary_field="id", # 主键 → id
# 扩展映射:新增time字段 + 原有su字段
metadata_fields={
"source": "su", # metadata["source"] → su字段
"doc_time": "time" # metadata["doc_time"] → time字段(核心新增)
},
auto_create_collection=False # 禁用自动创建,使用已有集合
)
三、在langchain中的默认概念
(1)文本类型使用Document对象和数据库交互
(2)库:连接默认default库
(3)集合(表):框架默认创建的集合为LangChainCollection
(4)字段:默认的字段为:text,pk(auto_id=False),vector,source