安装milvus以及向量库增删改操作

首先电脑已经安装了docker

windows电脑可下载yml文件
https://github.com/milvus-io/milvus/releases/download/v2.4.6/milvus-standalone-docker-compose.yml

创建milvus文件夹,并在这个目录下创建五个文件夹:conf、db、logs、pic、volumes、wal

然后在文件夹执行命令

cpp 复制代码
docker compose up -d

安装完成在docker里面启动

然后下载attu工具
attu工具下载地址

如果是centos服务器的话可以直接用宝塔无脑安装milvus

插入数据到milvus

python 复制代码
from pymilvus import connections
from langchain_community.vectorstores import Milvus
from langchain.embeddings.huggingface import HuggingFaceEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.docstore.document import Document
from langchain_community.embeddings import DashScopeEmbeddings
from milvus import default_server

# 定义嵌入模型(本地部署的embedding模型)
embedding = HuggingFaceEmbeddings(model_name='model/conan-embedding-v1/')
# 可以用自己本地的embedding模型,也可以用阿里和百度的embedding模型
#hfembedding = DashScopeEmbeddings(model="text-embedding-v2", dashscope_api_key="阿里云的apikei")
documentArray = [
    Document(page_content="在中国办理身份证的流程如下:准备材料:本人户口簿原件及复印件。原有身份证(如是换领)。如果是首次申领,需要提供监护人的户口簿和身份证。近期一寸免冠彩色照片(部分地区可能现场采集,无需自带)。其他可能需要的证明文件,具体可以咨询当地公安机关。预约:一些地区可能要求先在网上或通过电话预约办理时间。你可以访问当地的公安局官方网站或者使用"交管12123"等官方APP进行预约。前往户籍所在地派出所:携带上述所有材料到户籍所在地的公安分局或派出所的身份信息管理科申请办理。如果你是在异地工作或生活,某些情况下也可以在居住地的指定地点办理。填写表格:到达后,工作人员会给你一份《居民身份证申领登记表》,你需要如实填写个人信息。",
            metadata={
                "source": "https://www.baidu.com/",
                "title": "如何办理身份证?",
                "createTime": "2024-12-11 08:47"
            }),
]

# 使用递归字符文本分割器拆分文档
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=100,  # 设置块大小
    chunk_overlap=10,  # 设置重叠区域
    length_function=len
)

# 拆分文档
documents = text_splitter.split_documents(documentArray)

# 将文档和嵌入一起存入 Milvus 向量库
# db_name选择数据库
# collection_name选择表
vector_db = Milvus.from_documents(
    collection_name='test',
    documents=documents,  # 拆分后的文档
    embedding=embedding,  # 嵌入模型
    connection_args={"host": "127.0.0.1", "port": default_server.listen_port,"db_name":'test'},  # Milvus 连接参数
)

在milvus中查询

python 复制代码
from langchain_community.vectorstores import Milvus
from langchain.embeddings.huggingface import HuggingFaceEmbeddings

# 定义嵌入模型
embedding = HuggingFaceEmbeddings(model_name='model/conan-embedding-v1/')

# 设置vector_db 
vector_db = Milvus(
    collection_name='test',
    embedding_function=embedding,  # 使用关键字参数传递
    connection_args={"host": "127.0.0.1", "port": 19530}
)

query = "如何办理身份证"
#expr参数可以灵活设置条件
documents_all = vector_db.similarity_search(query,expr = "source == 'https://www.baidu.com/' and title like '%身份证%'")
print(documents_all)
#查询文档pk主键
listpks = vector_db.get_pks("source == 'https://www.baidu.com/'")

print(listpks)

在milvus中删除数据

python 复制代码
from langchain_community.vectorstores import Milvus
from langchain.embeddings.huggingface import HuggingFaceEmbeddings

# 定义嵌入模型
embedding = HuggingFaceEmbeddings(model_name='model/conan-embedding-v1/')

# 设置vector_db 
vector_db = Milvus(
    collection_name='test',
    embedding_function=embedding,
    connection_args={"host": "127.0.0.1", "port": 19530}
)
#查询出相关的pks
listpks = vector_db.get_pks("source == 'https://www.baidu.com/'")
#根据pks批量删除数据
res = vector_db.delete(listpks)
print(res)
相关推荐
阿里云大数据AI技术2 天前
通过阿里云 Milvus 与 PAI 搭建高效的检索增强对话系统
大数据·阿里云·云计算·milvus·向量检索
MonkeyKing_sunyuhua3 天前
milvus 支持向量化索引的方法
python·算法·milvus
Zilliz Planet4 天前
RAG开发中,如何用Milvus 2.5 BM25算法实现混合搜索
开发语言·python·算法·milvus
坐吃山猪12 天前
Milvus向量数据库04-Pipelines搭建RAG应用
数据库·milvus
❀͜͡傀儡师13 天前
使用docker-compose安装Milvus向量数据库及Attu可视化连接工具
数据库·docker·milvus
坐吃山猪13 天前
Milvus向量数据库01-基础概念
数据库·milvus
晨欣13 天前
Milvus中如何实现全文检索(Full Text Seach)?
python·全文检索·milvus
报名搜谷安13 天前
OSCP:我理解的Web环境知识
milvus·faiss·iotdb