Java ES 滚动查询

滚动查询(Scroll Query)是 Elasticsearch 提供的一种机制,用于处理大量数据的查询。它允许你在多个请求之间保持"游标",以便在后续请求中获取更多的结果。

以下是滚动查询的基本工作原理:

1 初始查询:

客户端发送一个查询请求给 Elasticsearch,并指定一个滚动时间(scroll time)。

2 首次返回结果:

Elasticsearch会处理这个查询请求,并将结果返回给客户端。

除了返回查询结果之外,还会返回一个特殊的"滚动ID"(scroll ID)。

3 保持连接:

客户端将这个滚动ID保存下来,以便在后续请求中使用。

4 后续查询:

在滚动时间内,客户端可以使用保存的滚动ID来获取更多的结果,而不需要重新发送完整的查询请求。

客户端发送一个滚动请求,并提供之前收到的滚动ID。

5 返回后续结果:

Elasticsearch会使用之前的滚动ID来获取接下来的结果,并将其返回给客户端。

如果有更多的结果可用,它也会返回一个新的滚动ID,以便在下一次请求中使用。

6 重复步骤4和步骤5:

客户端可以在滚动时间内多次使用滚动ID来获取更多的结果,直到没有更多的结果可用为止。

7 滚动ID的失效:

一旦滚动时间过期(在初始查询时指定的时间),或者客户端主动关闭滚动查询,相应的滚动ID将失效,不再能用于获取结果。

滚动查询的优点在于,它允许你在多个请求之间保持连接状态,从而能够处理大量数据而不会因为单次请求的数据量过大而出现问题。

需要注意的是,滚动查询并不适用于实时查询,因为它会保持资源开销,直到滚动时间过期或者显式关闭滚动查询为止。因此,滚动查询通常用于离线批量处理或需要处理大量数据的情况。

java 复制代码
@Test
public void searchScroll() {
	long gte = 0;
	long lt = 100000000;

	BoolQueryBuilder query = new BoolQueryBuilder();
	query.must(QueryBuilders.rangeQuery("createTime").gte(gte).lt(lt));

	NativeSearchQueryBuilder builder = new NativeSearchQueryBuilder();
	builder.withPageable(PageRequest.of(0, 500)); // 每次只处理500条数据
	builder.withQuery(query);

	// 查询
	IndexCoordinates index = "student";
	SearchScrollHits<Student> hits = template.searchScrollStart(
			60000L,
			builder.build(),
			Student.class,
			index);

	String scrollId = hits.getScrollId();
	List<String> scrollIdList = new LinkedList<>();
	scrollIdList.add(scrollId);

	List<CheckItemCount> list = new LinkedList<>();
	while (hits.hasSearchHits()) {

		// 处理数据
		List<SearchHit<Student>> hitList = hits.getSearchHits();
		for (SearchHit<Student> hit : hitList) {
			// 处理数据
		}
		
		// 滚动查询下一页
		hits = template.searchScrollContinue(scrollId, 60000L, Student.class, index);
		scrollId = hits.getScrollId();
		scrollIdList.add(scrollId);
		
	}
	// 清空滚动查询
	template.searchScrollClear(scrollIdList);
}
相关推荐
做一个快乐的小傻瓜2 分钟前
ZYNQ DEV套件引脚约束
java·linux·运维
CoderYanger2 分钟前
Java EE:6.网络编程套接字(第二弹)
java·网络·程序人生·面试·职场和发展·java-ee·学习方法
devilnumber3 分钟前
Java Lambda 表达式 200 条常见问题、坑点、易错点、规范清单
java·开发语言
极客先躯5 分钟前
高级java每日一道面试题-2026年02月12日-实战篇[Docker]-什么是容器的 Seccomp 配置?如何自定义?
java·运维·分布式·docker·容器·自动化·文件
是潮汕的灿灿展吖5 分钟前
elasticsearch单机版本数据迁移
大数据·elasticsearch·搜索引擎
大大杰哥6 分钟前
Vue2学习(3)--组件中的通信方式/组件之间的交互
java·前端·javascript
zzz_23686 分钟前
【Java基础】二叉树遍历与红黑树的完美平衡艺术——从递归崩溃到自平衡的硬核拆解
java·开发语言
程序员zgh7 分钟前
C++ 万能引用与完美转发
c语言·开发语言·c++·经验分享·学习
斯内普吖9 分钟前
(开源)高校素拓分管理系统小程序实战指南 基于 Java + SpringBoot + uni-app + Vue + MySQL
java·spring boot·mysql·小程序·uni-app·开源
Elasticsearch11 分钟前
你的 search index 已经是一个 agent 记忆系统 : 用于 Claude Code 的持久化 agent memory
elasticsearch