使用 RestHighLevelClient 进行 Elasticsearch 分页查询

在处理大量数据的搜索应用中,分页查询是一种常见的需求。Elasticsearch 以其灵活的搜索能力,支持高效的分页查询操作。本文将介绍如何在 Java 应用程序中使用 Elasticsearch 的 RestHighLevelClient 执行分页查询,并展示如何结合排序进行结果的有序展示。

环境准备

确保你的项目中已经添加了 Elasticsearch 客户端库的依赖。如果使用 Maven,可以在 pom.xml 文件中添加如下依赖:

xml 复制代码
<dependency>
    <groupId>org.elasticsearch.client</groupId>
    <artifactId>elasticsearch-rest-high-level</artifactId>
    <version>7.10.0</version> <!-- 使用适合的版本号 -->
</dependency>

分页查询示例

1. 分页查询基础

在 Elasticsearch 中,可以通过设置 fromsize 参数来实现分页查询。

Java Code
java 复制代码
@Test
void testPagination() throws IOException {
    // 页码,每页大小
    int page = 1, size = 5;
    // 1. 准备 SearchRequest
    SearchRequest request = new SearchRequest("hotel"); // 指定索引名称

    // 2. 准备 DSL 查询
    request.source()
            .query(QueryBuilders.matchAllQuery()) // 查询所有文档
            .sort("price", SortOrder.ASC) // 按价格升序排序
            .from((page - 1) * size) // 分页开始位置
            .size(size); // 每页大小

    // 3. 发送请求
    SearchResponse response = client.search(request, RequestOptions.DEFAULT);

    // 4. 解析响应
    handleResponse(response);
}
DSL Equivalent
json 复制代码
GET /hotel/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "price": {
        "order": "asc"
      }
    }
  ],
  "from": 0,
  "size": 5
}

2. 响应处理

定义一个通用方法来处理搜索响应,打印结果。

java 复制代码
private void handleResponse(SearchResponse response) throws IOException {
    SearchHits searchHits = response.getHits();
    long total = searchHits.getTotalHits().value;
    System.out.println("共搜索到 " + total + " 条数据");

    for (SearchHit hit : searchHits.getHits()) {
        String json = hit.getSourceAsString();
        System.out.println(json);
    }
}

结语

Elasticsearch 的分页查询功能通过简单的 API 调用即可实现,结合 fromsize 参数,我们可以轻松地对搜索结果进行分页处理。在实际应用中,分页查询可以显著提高用户体验和后端性能。本文提供的示例代码展示了如何使用 Java 的 RestHighLevelClient 进行分页查询,并给出了对应的 DSL 查询语句,帮助你更好地理解和使用 Elasticsearch 的分页功能。

相关推荐
QYR_Jodie15 分钟前
2026-2032期间,全球陶瓷餐具和玻璃器皿市场年复合增长率(CAGR)为2.9%
大数据·人工智能
派拉软件42 分钟前
从 IAM 到 AAM,重构 AI Agent 时代的访问控制体系
大数据·人工智能·网络安全·重构·iam·身份与访问控制·aam
wei_shuo1 小时前
办公小浣熊Office Raccoon 2.0智能助手:帮助我真正实现数据处理工作中的降本、增效、提质
大数据·ai·数据处理
treesforest2 小时前
Ipdatacloud IP 地址查询方案适合哪些场景?
大数据·网络·数据库·网络协议·tcp/ip·ip
Elastic 中国社区官方博客2 小时前
Jina embeddings v3 现已在 Gemini Enterprise Agent Platform Model Garden 上可用
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·jina
数智化精益手记局3 小时前
4m变更管理实战:拆解4m变更管理四大要素的管控功能与常见难题
大数据·数据结构·数据库·人工智能·精益工程
DeepSCRM3 小时前
从“断开实体假说”谈起:重构跨域多平台SCRM体系的技术逻辑与实战方案
大数据·重构
财经资讯数据_灵砚智能3 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年4月23日
大数据·人工智能·python·信息可视化·自然语言处理
yuanmazhiwu3 小时前
计算机毕业设计:Python股市行情可视化与ARIMA预测系统 Flask框架 ARIMA 数据分析 可视化 大数据 大模型(建议收藏)✅
大数据·python·数据分析·django·flask·课程设计
Never_every993 小时前
8 个高清 4K 视频素材网址!无水印可商用
大数据·前端·音视频·视频