安装milvus以及向量库增删改操作

首先电脑已经安装了docker

windows电脑可下载yml文件
https://github.com/milvus-io/milvus/releases/download/v2.4.6/milvus-standalone-docker-compose.yml

创建milvus文件夹,并在这个目录下创建五个文件夹:conf、db、logs、pic、volumes、wal

然后在文件夹执行命令

cpp 复制代码
docker compose up -d

安装完成在docker里面启动

然后下载attu工具
attu工具下载地址

如果是centos服务器的话可以直接用宝塔无脑安装milvus

插入数据到milvus

python 复制代码
from pymilvus import connections
from langchain_community.vectorstores import Milvus
from langchain.embeddings.huggingface import HuggingFaceEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.docstore.document import Document
from langchain_community.embeddings import DashScopeEmbeddings
from milvus import default_server

# 定义嵌入模型(本地部署的embedding模型)
embedding = HuggingFaceEmbeddings(model_name='model/conan-embedding-v1/')
# 可以用自己本地的embedding模型,也可以用阿里和百度的embedding模型
#hfembedding = DashScopeEmbeddings(model="text-embedding-v2", dashscope_api_key="阿里云的apikei")
documentArray = [
    Document(page_content="在中国办理身份证的流程如下:准备材料:本人户口簿原件及复印件。原有身份证(如是换领)。如果是首次申领,需要提供监护人的户口簿和身份证。近期一寸免冠彩色照片(部分地区可能现场采集,无需自带)。其他可能需要的证明文件,具体可以咨询当地公安机关。预约:一些地区可能要求先在网上或通过电话预约办理时间。你可以访问当地的公安局官方网站或者使用"交管12123"等官方APP进行预约。前往户籍所在地派出所:携带上述所有材料到户籍所在地的公安分局或派出所的身份信息管理科申请办理。如果你是在异地工作或生活,某些情况下也可以在居住地的指定地点办理。填写表格:到达后,工作人员会给你一份《居民身份证申领登记表》,你需要如实填写个人信息。",
            metadata={
                "source": "https://www.baidu.com/",
                "title": "如何办理身份证?",
                "createTime": "2024-12-11 08:47"
            }),
]

# 使用递归字符文本分割器拆分文档
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=100,  # 设置块大小
    chunk_overlap=10,  # 设置重叠区域
    length_function=len
)

# 拆分文档
documents = text_splitter.split_documents(documentArray)

# 将文档和嵌入一起存入 Milvus 向量库
# db_name选择数据库
# collection_name选择表
vector_db = Milvus.from_documents(
    collection_name='test',
    documents=documents,  # 拆分后的文档
    embedding=embedding,  # 嵌入模型
    connection_args={"host": "127.0.0.1", "port": default_server.listen_port,"db_name":'test'},  # Milvus 连接参数
)

在milvus中查询

python 复制代码
from langchain_community.vectorstores import Milvus
from langchain.embeddings.huggingface import HuggingFaceEmbeddings

# 定义嵌入模型
embedding = HuggingFaceEmbeddings(model_name='model/conan-embedding-v1/')

# 设置vector_db 
vector_db = Milvus(
    collection_name='test',
    embedding_function=embedding,  # 使用关键字参数传递
    connection_args={"host": "127.0.0.1", "port": 19530}
)

query = "如何办理身份证"
#expr参数可以灵活设置条件
documents_all = vector_db.similarity_search(query,expr = "source == 'https://www.baidu.com/' and title like '%身份证%'")
print(documents_all)
#查询文档pk主键
listpks = vector_db.get_pks("source == 'https://www.baidu.com/'")

print(listpks)

在milvus中删除数据

python 复制代码
from langchain_community.vectorstores import Milvus
from langchain.embeddings.huggingface import HuggingFaceEmbeddings

# 定义嵌入模型
embedding = HuggingFaceEmbeddings(model_name='model/conan-embedding-v1/')

# 设置vector_db 
vector_db = Milvus(
    collection_name='test',
    embedding_function=embedding,
    connection_args={"host": "127.0.0.1", "port": 19530}
)
#查询出相关的pks
listpks = vector_db.get_pks("source == 'https://www.baidu.com/'")
#根据pks批量删除数据
res = vector_db.delete(listpks)
print(res)
相关推荐
小毅&Nora1 天前
【向量数据库】Milvus 向量数据库 ④ 向量索引的存储结构与查询执行模型:从 Faiss 到 Knowhere 的源码解剖
向量·milvus·faiss
码农胖虎-java1 天前
【AI】向量数据库选型实战:pgvector vs Milvus vs Qdrant
数据库·milvus·pg
树叶会结冰2 天前
Milvus:可检索记忆的漂流瓶
langchain·milvus·llamaindex
Learn Forever3 天前
【向量库-Milvus】Milvus部署及使用
milvus
秋氘渔3 天前
LlamaIndex 实战 Milvus 向量数据库:从 CRUD 到 智能检索
milvus·llamaindex
玖日大大4 天前
Milvus 深度解析:开源向量数据库的技术架构、实践指南与生态生态
数据库·开源·milvus
长路 ㅤ   6 天前
Milvus向量库Java对接使用指南
milvus·向量数据库·索引优化·混合搜索·ann搜索
福大大架构师每日一题7 天前
milvus v2.6.8 发布:搜索高亮上线,性能与稳定性全面跃升,生产环境强烈推荐升级
android·java·milvus
Clarence Liu10 天前
Milvus学习(1) 架构和部署
学习·架构·milvus
托尼吴10 天前
milvus 向量数据库学习笔记-基础认识
数据库·学习·milvus