使用 RestHighLevelClient 进行 Elasticsearch 分页查询

在处理大量数据的搜索应用中,分页查询是一种常见的需求。Elasticsearch 以其灵活的搜索能力,支持高效的分页查询操作。本文将介绍如何在 Java 应用程序中使用 Elasticsearch 的 RestHighLevelClient 执行分页查询,并展示如何结合排序进行结果的有序展示。

环境准备

确保你的项目中已经添加了 Elasticsearch 客户端库的依赖。如果使用 Maven,可以在 pom.xml 文件中添加如下依赖:

xml 复制代码
<dependency>
    <groupId>org.elasticsearch.client</groupId>
    <artifactId>elasticsearch-rest-high-level</artifactId>
    <version>7.10.0</version> <!-- 使用适合的版本号 -->
</dependency>

分页查询示例

1. 分页查询基础

在 Elasticsearch 中,可以通过设置 fromsize 参数来实现分页查询。

Java Code
java 复制代码
@Test
void testPagination() throws IOException {
    // 页码,每页大小
    int page = 1, size = 5;
    // 1. 准备 SearchRequest
    SearchRequest request = new SearchRequest("hotel"); // 指定索引名称

    // 2. 准备 DSL 查询
    request.source()
            .query(QueryBuilders.matchAllQuery()) // 查询所有文档
            .sort("price", SortOrder.ASC) // 按价格升序排序
            .from((page - 1) * size) // 分页开始位置
            .size(size); // 每页大小

    // 3. 发送请求
    SearchResponse response = client.search(request, RequestOptions.DEFAULT);

    // 4. 解析响应
    handleResponse(response);
}
DSL Equivalent
json 复制代码
GET /hotel/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "price": {
        "order": "asc"
      }
    }
  ],
  "from": 0,
  "size": 5
}

2. 响应处理

定义一个通用方法来处理搜索响应,打印结果。

java 复制代码
private void handleResponse(SearchResponse response) throws IOException {
    SearchHits searchHits = response.getHits();
    long total = searchHits.getTotalHits().value;
    System.out.println("共搜索到 " + total + " 条数据");

    for (SearchHit hit : searchHits.getHits()) {
        String json = hit.getSourceAsString();
        System.out.println(json);
    }
}

结语

Elasticsearch 的分页查询功能通过简单的 API 调用即可实现,结合 fromsize 参数,我们可以轻松地对搜索结果进行分页处理。在实际应用中,分页查询可以显著提高用户体验和后端性能。本文提供的示例代码展示了如何使用 Java 的 RestHighLevelClient 进行分页查询,并给出了对应的 DSL 查询语句,帮助你更好地理解和使用 Elasticsearch 的分页功能。

相关推荐
椿融雪几秒前
分布式搜索和分析引擎Elasticsearch实战指南
大数据·分布式·elasticsearch
Hello.Reader37 分钟前
Elasticsearch 全文检索与过滤
elasticsearch·django·全文检索
拓端研究室1 小时前
专题:2025机器人产业技术图谱与商业化指南|附130+份报告PDF、数据汇总下载
大数据·人工智能
码界筑梦坊1 小时前
91-基于Spark的空气质量数据分析可视化系统
大数据·python·数据分析·spark·django·numpy·pandas
linweidong2 小时前
深入剖析 Spark Shuffle 机制:从原理到实战优化
大数据·分布式·spark·spark sql·数据开发·shuffle·数据倾斜
字节跳动数据平台2 小时前
企业落地 Data Agent,一共需要几步?
大数据·agent
涛思数据(TDengine)2 小时前
时序数据库厂商 TDengine 发布 AI 原生的工业数据管理平台 IDMP,“无问智推”改变数据消费范式
大数据·运维·数据库·人工智能·tdengine
想你依然心痛2 小时前
Spark大数据分与实践笔记(第五章 HBase分布式数据库-04)
大数据·数据库·分布式
Circ.2 小时前
使用es实现全文检索并且高亮显示
elasticsearch·django·全文检索
智海观潮14 小时前
Unity Catalog与Apache Iceberg如何重塑Data+AI时代的企业数据架构
大数据·人工智能·ai·iceberg·catalog