Qdrant 的基础教程

目录

Qdrant是一个开源的向量数据库,它专注于高维向量的快速相似性搜索。以下是一个基础的Qdrant教程,帮助你开始使用Qdrant进行向量数据的存储和搜索。

安装Qdrant

首先,你需要安装Qdrant服务。Qdrant提供了Docker镜像,使得安装和运行非常简单。

bash 复制代码
# 使用Docker拉取Qdrant镜像并运行
docker pull qdrant/qdrant:latest
docker run -p 6333:6333 qdrant/qdrant:latest

安装Qdrant客户端

Qdrant提供了Python客户端,你可以通过pip安装它。

bash 复制代码
pip install qdrant-client

初始化Qdrant客户端

在Python中,你可以初始化Qdrant客户端并连接到Qdrant服务。

python 复制代码
from qdrant_client import QdrantClient
# 初始化客户端
client = QdrantClient(host='localhost', port=6333)

创建集合(Collection)

在Qdrant中,你需要创建一个集合来存储向量数据。

python 复制代码
# 创建集合的schema
collection_schema = {
    "name": "my_collection",
    "vector_size": 128,
    "distance": "Cosine"
}
# 创建集合
client.create_collection(collection_schema)

插入向量数据

接下来,你可以向集合中插入向量数据。

python 复制代码
# 准备向量数据
vectors = [[random.random() for _ in range(128)] for _ in range(1000)]
ids = list(range(1000))
# 插入向量
client.upsert_points(collection_name="my_collection", points={"ids": ids, "vectors": vectors})

创建索引

为了加速搜索,你需要为集合创建索引。

python 复制代码
# 创建索引
client.create_index(collection_name="my_collection", index_params={"metric": "Cosine", "hnsw_config": {"m": 16, "ef_construction": 200}})

搜索向量

现在你可以使用Qdrant进行向量搜索了。

python 复制代码
# 准备查询向量
query_vector = [random.random() for _ in range(128)]
query_result = client.search(collection_name="my_collection", query_vector=query_vector, limit=10)
# 打印搜索结果
for hit in query_result:
    print(f"ID: {hit.id}, Score: {hit.score}")

清理资源

如果你不再需要集合,可以删除它。

python 复制代码
client.delete_collection(collection_name="my_collection")

以上是Qdrant的基础使用流程。你可以根据具体的应用需求调整集合的配置、索引参数和搜索逻辑。Qdrant的官方文档提供了更详细的指南和高级功能,你可以查阅官方文档以获取更多信息。

相关推荐
JHC0000004 小时前
基于Ollama,Milvus构建的建议知识检索系统
人工智能·python·milvus
mOok ONSC4 小时前
SpringBoot项目中读取resource目录下的文件(六种方法)
spring boot·python·pycharm
Flittly4 小时前
【SpringAIAlibaba新手村系列】(11)Embedding 向量化与向量数据库
java·笔记·spring·ai·springboot
入瘾4 小时前
etcd 显示连接失败
数据库·chrome·etcd
本体智能5 小时前
预制指标、宽表、SQL、本体ABC:真正决定长期成本的,是一次变更会波及多少层
数据库·sql·本体神经网络·uino数据智能引擎
长安11085 小时前
数据库基础知识----数据库大观
数据库·oracle
GIS兵墩墩5 小时前
postgis--PostgreSQL16及其plpython3u扩展
python·postgis
new Object ~5 小时前
LangChain的短期记忆存储实现
python·langchain
魔都吴所谓5 小时前
【Python】从零构建:IP地理位置查询实战指南
开发语言·python·tcp/ip
测试19985 小时前
使用Python自动化生成接口测试用例
自动化测试·软件测试·python·测试工具·职场和发展·测试用例·接口测试