Qdrant 的基础教程

目录

Qdrant是一个开源的向量数据库,它专注于高维向量的快速相似性搜索。以下是一个基础的Qdrant教程,帮助你开始使用Qdrant进行向量数据的存储和搜索。

安装Qdrant

首先,你需要安装Qdrant服务。Qdrant提供了Docker镜像,使得安装和运行非常简单。

bash 复制代码
# 使用Docker拉取Qdrant镜像并运行
docker pull qdrant/qdrant:latest
docker run -p 6333:6333 qdrant/qdrant:latest

安装Qdrant客户端

Qdrant提供了Python客户端,你可以通过pip安装它。

bash 复制代码
pip install qdrant-client

初始化Qdrant客户端

在Python中,你可以初始化Qdrant客户端并连接到Qdrant服务。

python 复制代码
from qdrant_client import QdrantClient
# 初始化客户端
client = QdrantClient(host='localhost', port=6333)

创建集合(Collection)

在Qdrant中,你需要创建一个集合来存储向量数据。

python 复制代码
# 创建集合的schema
collection_schema = {
    "name": "my_collection",
    "vector_size": 128,
    "distance": "Cosine"
}
# 创建集合
client.create_collection(collection_schema)

插入向量数据

接下来,你可以向集合中插入向量数据。

python 复制代码
# 准备向量数据
vectors = [[random.random() for _ in range(128)] for _ in range(1000)]
ids = list(range(1000))
# 插入向量
client.upsert_points(collection_name="my_collection", points={"ids": ids, "vectors": vectors})

创建索引

为了加速搜索,你需要为集合创建索引。

python 复制代码
# 创建索引
client.create_index(collection_name="my_collection", index_params={"metric": "Cosine", "hnsw_config": {"m": 16, "ef_construction": 200}})

搜索向量

现在你可以使用Qdrant进行向量搜索了。

python 复制代码
# 准备查询向量
query_vector = [random.random() for _ in range(128)]
query_result = client.search(collection_name="my_collection", query_vector=query_vector, limit=10)
# 打印搜索结果
for hit in query_result:
    print(f"ID: {hit.id}, Score: {hit.score}")

清理资源

如果你不再需要集合,可以删除它。

python 复制代码
client.delete_collection(collection_name="my_collection")

以上是Qdrant的基础使用流程。你可以根据具体的应用需求调整集合的配置、索引参数和搜索逻辑。Qdrant的官方文档提供了更详细的指南和高级功能,你可以查阅官方文档以获取更多信息。

相关推荐
这个DBA有点耶13 小时前
NULL不是空——数据库里最反直觉的设计,90%新人踩过的坑
数据库·mysql·代码规范
用户83562907805113 小时前
Python 实现 PDF 文件加密与解密方法
后端·python
用户83562907805113 小时前
使用 Python 冻结与拆分 Excel 窗格教程
后端·python
这个DBA有点耶15 小时前
AI写的SQL跑崩了生产库,这锅谁背?
数据库·人工智能·程序员
镜舟科技16 小时前
Databricks 再提 LTAP,AI 时代的数据底座为何重回大一统叙事?
数据库·架构·agent
Databend17 小时前
从湖仓升级为 Agent 时代的数据控制面,Snowflake 和 Databricks 有哪些布局
大数据·数据库·agent
ClouGence20 小时前
SQL Server CDC 能放到 Always On 备库读吗?一文讲透原理与实践
数据库·sql server
你好潘先生21 小时前
别再记命令了,用 yeero do 说句人话就能跑脚本,而且不烧 token
服务器·python·命令行
Agent_大师1 天前
WebSocket 行情重连成功,K线缺口不会自动消失
python
荣码1 天前
LLM结构化输出:让AI返回JSON而不是废话,我踩了4个坑
java·python