使用 RestHighLevelClient 进行 Elasticsearch 分页查询

在处理大量数据的搜索应用中,分页查询是一种常见的需求。Elasticsearch 以其灵活的搜索能力,支持高效的分页查询操作。本文将介绍如何在 Java 应用程序中使用 Elasticsearch 的 RestHighLevelClient 执行分页查询,并展示如何结合排序进行结果的有序展示。

环境准备

确保你的项目中已经添加了 Elasticsearch 客户端库的依赖。如果使用 Maven,可以在 pom.xml 文件中添加如下依赖:

xml 复制代码
<dependency>
    <groupId>org.elasticsearch.client</groupId>
    <artifactId>elasticsearch-rest-high-level</artifactId>
    <version>7.10.0</version> <!-- 使用适合的版本号 -->
</dependency>

分页查询示例

1. 分页查询基础

在 Elasticsearch 中,可以通过设置 fromsize 参数来实现分页查询。

Java Code
java 复制代码
@Test
void testPagination() throws IOException {
    // 页码,每页大小
    int page = 1, size = 5;
    // 1. 准备 SearchRequest
    SearchRequest request = new SearchRequest("hotel"); // 指定索引名称

    // 2. 准备 DSL 查询
    request.source()
            .query(QueryBuilders.matchAllQuery()) // 查询所有文档
            .sort("price", SortOrder.ASC) // 按价格升序排序
            .from((page - 1) * size) // 分页开始位置
            .size(size); // 每页大小

    // 3. 发送请求
    SearchResponse response = client.search(request, RequestOptions.DEFAULT);

    // 4. 解析响应
    handleResponse(response);
}
DSL Equivalent
json 复制代码
GET /hotel/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "price": {
        "order": "asc"
      }
    }
  ],
  "from": 0,
  "size": 5
}

2. 响应处理

定义一个通用方法来处理搜索响应,打印结果。

java 复制代码
private void handleResponse(SearchResponse response) throws IOException {
    SearchHits searchHits = response.getHits();
    long total = searchHits.getTotalHits().value;
    System.out.println("共搜索到 " + total + " 条数据");

    for (SearchHit hit : searchHits.getHits()) {
        String json = hit.getSourceAsString();
        System.out.println(json);
    }
}

结语

Elasticsearch 的分页查询功能通过简单的 API 调用即可实现,结合 fromsize 参数,我们可以轻松地对搜索结果进行分页处理。在实际应用中,分页查询可以显著提高用户体验和后端性能。本文提供的示例代码展示了如何使用 Java 的 RestHighLevelClient 进行分页查询,并给出了对应的 DSL 查询语句,帮助你更好地理解和使用 Elasticsearch 的分页功能。

相关推荐
Yvonne9781 小时前
创建三个节点
java·大数据
OJAC近屿智能4 小时前
苹果新品今日发布,AI手机市场竞争加剧,近屿智能专注AI人才培养
大数据·人工智能·ai·智能手机·aigc·近屿智能
lucky_syq5 小时前
Spark算子:大数据处理的魔法棒
大数据·分布式·spark
m0_748233647 小时前
【分布式】Hadoop完全分布式的搭建(零基础)
大数据·hadoop·分布式
圣享科技SMARTLIC7 小时前
企业软件合规性管理:构建高效、安全的软件资产生态
大数据·安全·浮动许可证监控·许可证管理·浮动许可证优化·软件资产管理·浮动许可证管理
京东零售技术8 小时前
京东广告基于 Apache Doris 的冷热数据分层实践
大数据
D愿你归来仍是少年8 小时前
解决Python升级导致PySpark任务异常方案
大数据·开发语言·python·spark
光仔December8 小时前
【Elasticsearch入门到落地】8、RestClient操作索引库-基础介绍及导入demo
elasticsearch·搜索引擎·全文检索·索引·映射
risc1234568 小时前
【Elasticsearch】Retrieve inner hits获取嵌套查询的具体的嵌套文档来源,以及父子文档的来源
elasticsearch
薇晶晶8 小时前
如何安装Hadoop
大数据·hadoop·分布式