如何快速使用向量检索服务DashVector?

免费体验阿里云高性能向量检索服务:https://www.aliyun.com/product/ai/dashvector


本文将介绍如何快速上手使用向量检索服务DashVector。

前提条件

说明

  1. 需要使用您的api-key替换示例中的YOUR_API_KEY、您的Cluster Endpoint替换示例中的YOUR_CLUSTER_ENDPOINT,代码才能正常运行。

  2. Cluster Endpoint,可在控制台"Cluster详情"中查看。

Step1. 创建Client

使用HTTP API时可跳过本步骤。

Python示例:

复制代码
import dashvector

client = dashvector.Client(
    api_key='YOUR_API_KEY',
    endpoint='YOUR_CLUSTER_ENDPOINT'
)
assert client

Step2. 创建Collection

创建一个名称为quickstart,向量维度为4的collection。

Python示例:

复制代码
client.create(name='quickstart', dimension=4)

collection = client.get('quickstart')
assert collection

说明

1.在未指定距离度量参数时,将使用默认的Cosine距离度量方式。

2.在未指定向量数据类型时,将使用默认的Float数据类型。

Step3. 插入Doc

Python示例:

复制代码
from dashvector import Doc

# 通过dashvector.Doc对象,插入单条数据
collection.insert(Doc(id='1', vector=[0.1, 0.2, 0.3, 0.4]))

# 通过dashvector.Doc对象,批量插入2条数据
collection.insert(
    [
        Doc(id='2', vector=[0.2, 0.3, 0.4, 0.5], fields={'age': 20, 'name': 'zhangsan'}),
        Doc(id='3', vector=[0.3, 0.4, 0.5, 0.6], fields={'anykey': 'anyvalue'})    
    ]
)

Step4. 相似性检索

Python示例:

复制代码
rets = collection.query([0.1, 0.2, 0.3, 0.4], topk=2)

print(rets)

Step5. 删除Doc

Python示例:

复制代码
# 删除1条数据
collection.delete(ids=['1'])

Step6. 查看Collection统计信息

Python示例:

复制代码
stats = collection.stats()

print(stats)

Step7. 删除Collection

Python示例:

复制代码
client.delete('quickstart')

免费体验阿里云高性能向量检索服务:https://www.aliyun.com/product/ai/dashvector

相关推荐
Codebee6 小时前
能力中心 (Agent SkillCenter):开启AI技能管理新时代
人工智能
陌上丨7 小时前
Redis的Key和Value的设计原则有哪些?
数据库·redis·缓存
聆风吟º7 小时前
CANN runtime 全链路拆解:AI 异构计算运行时的任务管理与功能适配技术路径
人工智能·深度学习·神经网络·cann
uesowys7 小时前
Apache Spark算法开发指导-One-vs-Rest classifier
人工智能·算法·spark
AI_56787 小时前
AWS EC2新手入门:6步带你从零启动实例
大数据·数据库·人工智能·机器学习·aws
User_芊芊君子7 小时前
CANN大模型推理加速引擎ascend-transformer-boost深度解析:毫秒级响应的Transformer优化方案
人工智能·深度学习·transformer
ValhallaCoder7 小时前
hot100-二叉树I
数据结构·python·算法·二叉树
ccecw8 小时前
Mysql ONLY_FULL_GROUP_BY模式详解、group by非查询字段报错
数据库·mysql
JH30738 小时前
达梦数据库与MySQL的核心差异解析:从特性到实践
数据库·mysql
数据知道8 小时前
PostgreSQL 核心原理:如何利用多核 CPU 加速大数据量扫描(并行查询)
数据库·postgresql