使用 RestHighLevelClient 进行 Elasticsearch 分页查询

在处理大量数据的搜索应用中,分页查询是一种常见的需求。Elasticsearch 以其灵活的搜索能力,支持高效的分页查询操作。本文将介绍如何在 Java 应用程序中使用 Elasticsearch 的 RestHighLevelClient 执行分页查询,并展示如何结合排序进行结果的有序展示。

环境准备

确保你的项目中已经添加了 Elasticsearch 客户端库的依赖。如果使用 Maven,可以在 pom.xml 文件中添加如下依赖:

xml 复制代码
<dependency>
    <groupId>org.elasticsearch.client</groupId>
    <artifactId>elasticsearch-rest-high-level</artifactId>
    <version>7.10.0</version> <!-- 使用适合的版本号 -->
</dependency>

分页查询示例

1. 分页查询基础

在 Elasticsearch 中,可以通过设置 fromsize 参数来实现分页查询。

Java Code
java 复制代码
@Test
void testPagination() throws IOException {
    // 页码,每页大小
    int page = 1, size = 5;
    // 1. 准备 SearchRequest
    SearchRequest request = new SearchRequest("hotel"); // 指定索引名称

    // 2. 准备 DSL 查询
    request.source()
            .query(QueryBuilders.matchAllQuery()) // 查询所有文档
            .sort("price", SortOrder.ASC) // 按价格升序排序
            .from((page - 1) * size) // 分页开始位置
            .size(size); // 每页大小

    // 3. 发送请求
    SearchResponse response = client.search(request, RequestOptions.DEFAULT);

    // 4. 解析响应
    handleResponse(response);
}
DSL Equivalent
json 复制代码
GET /hotel/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "price": {
        "order": "asc"
      }
    }
  ],
  "from": 0,
  "size": 5
}

2. 响应处理

定义一个通用方法来处理搜索响应,打印结果。

java 复制代码
private void handleResponse(SearchResponse response) throws IOException {
    SearchHits searchHits = response.getHits();
    long total = searchHits.getTotalHits().value;
    System.out.println("共搜索到 " + total + " 条数据");

    for (SearchHit hit : searchHits.getHits()) {
        String json = hit.getSourceAsString();
        System.out.println(json);
    }
}

结语

Elasticsearch 的分页查询功能通过简单的 API 调用即可实现,结合 fromsize 参数,我们可以轻松地对搜索结果进行分页处理。在实际应用中,分页查询可以显著提高用户体验和后端性能。本文提供的示例代码展示了如何使用 Java 的 RestHighLevelClient 进行分页查询,并给出了对应的 DSL 查询语句,帮助你更好地理解和使用 Elasticsearch 的分页功能。

相关推荐
gaosushexiangji11 分钟前
应用探析|千眼狼PIV测量系统在职业病防治中的应用
大数据·人工智能·科技·数码相机
1892280486115 分钟前
NY182NY183美光固态颗粒NY186NY188
大数据·网络·科技
爱吃香菜---www2 小时前
spark-standalone
大数据·分布式·spark
依年南台2 小时前
安装Hadoop并运行WordCount程序
大数据·hadoop
TDengine (老段)3 小时前
基于 TSBS 标准数据集下 TimescaleDB、InfluxDB 与 TDengine 性能对比测试报告
java·大数据·开发语言·数据库·时序数据库·tdengine·iotdb
TDengine (老段)3 小时前
TDengine 在金融领域的应用
大数据·数据库·物联网·金融·时序数据库·tdengine·涛思数据
懒惰的橘猫3 小时前
RDD-自定义分区器案例
大数据
富能量爆棚4 小时前
Spark缓存-cache
大数据·spark
依年南台4 小时前
Spark处理过程-案例数据清洗
大数据·hadoop
猪猪果泡酒4 小时前
Spark,RDD中的转换算子
大数据·分布式·spark