milvus数据库-查询

与向量相似性搜索不同,向量查询通过基于布尔表达式的标量过滤来检索向量。Milvus支持许多标量字段中的数据类型和各种布尔表达式。布尔表达式过滤标量字段或主键字段,并检索与过滤器匹配的所有结果。

一、单次查询

1.加载集合

2.执行查询

python 复制代码
# 使用集合对象的 query 方法来执行查询操作
res = collection.query(
    expr="book_id in [2,4,6,8]",  # 查询表达式,筛选满足条件的文档
    offset=0,  # 结果的偏移量,从结果中的第一个文档开始返回
    limit=10,  # 返回结果的最大数量
    output_fields=["book_id", "book_intro"]  # 指定要从查询结果中检索的字段
)

3.检查输出

python 复制代码
sorted_res = sorted(res, key=lambda k: k['book_id'])
sorted_res

4.统计实体

在执行查询时,将输出字段设置为count(*),就会返回检索到的实体数量。此时禁用limit

python 复制代码
res = collection.query(
  # filter entities whose ID is in the specified list
  expr="book_id in [2,4,6,8]", 
  output_fields = ["count(*)"],
)

print(res)
print(res[0])

二、查询时使用迭代器

1.使用迭代器查询

python 复制代码
expr = "600 <= num_pages <= 700"

output_fields=[bookID, authors]

limit = 5

query_iterator = collection.query_iterator(expr, output_fields, limit)

while True:
    # turn to the next page
    res = query_iterator.next()
    if len(res) == 0:
        print("query iteration finished, close")
        # close the iterator
        query_iterator.close()
        break
    for i in range(len(res)):
        print(res[i])

2.使用迭代器搜索

python 复制代码
vectors_to_search = rng.random((SEARCH_NQ, DIM))

search_params = {
    "metric_type": "L2",
    "params": {"nprobe": 10, "radius": 1.0},
}

search_iterator = collection.search_iterator(
    vectors_to_search,
    search_params,
    limit=5,
    output_fields=[bookID, authors]
)
                                             
while True:
    # turn to the next page
    res = search_iterator.next()
    if len(res[0]) == 0:
        print("search iteration finished, close")
        # close the iterator
        search_iterator.close()
        break
    for i in range(len(res[0])):
        print(res[0][i])
相关推荐
寻星探路13 小时前
【深度长文】万字攻克网络原理:从 HTTP 报文解构到 HTTPS 终极加密逻辑
java·开发语言·网络·python·http·ai·https
陌上丨15 小时前
Redis的Key和Value的设计原则有哪些?
数据库·redis·缓存
曹牧15 小时前
Spring Boot:如何测试Java Controller中的POST请求?
java·开发语言
AI_567815 小时前
AWS EC2新手入门:6步带你从零启动实例
大数据·数据库·人工智能·机器学习·aws
ccecw16 小时前
Mysql ONLY_FULL_GROUP_BY模式详解、group by非查询字段报错
数据库·mysql
JH307316 小时前
达梦数据库与MySQL的核心差异解析:从特性到实践
数据库·mysql
数据知道16 小时前
PostgreSQL 核心原理:如何利用多核 CPU 加速大数据量扫描(并行查询)
数据库·postgresql
爬山算法16 小时前
Hibernate(90)如何在故障注入测试中使用Hibernate?
java·后端·hibernate
kfyty72516 小时前
集成 spring-ai 2.x 实践中遇到的一些问题及解决方案
java·人工智能·spring-ai