ElastaticSearch -- es深度分页 searchAfter

searchAfter深度分页

es一次只能查1万条数据,如果超过1万,会报错如下:

复制代码
        "reason": {
          "type": "query_phase_execution_exception",
          "reason": "Result window is too large, from + size must be less than or equal to: [10000] but was [10001]. See the scroll api for a more efficient way to request large data sets. This limit can be set by changing the [index.max_result_window] index level setting."
        }

可以调整es配置的index.max_result_window这个参数,来查询更多的数据,但这并不是很好的办法,最好使用 searchAfter.

searchAfter作用类似于以下sql语句:

复制代码
-- 查询第10001--10005条数据
SELECT * FROM  t_user  order by name,birthDay  LIMIT 10000,5;

dsl

  • 第一次查询,查询1--10000条数据,找出第10000条数据的排序字段结果

    GET /user_info/_search
    {
    "size": 10000,
    "sort": [{
    "name": {
    "order": "asc"
    }
    },
    {
    "birthDay": {
    "order": "desc"
    }
    }]
    }

  • 第二次查询,根据上面最后一条数据的排序字段,查询出第 10001--20000条数据;
    多了一个search_after的查询条件,对应的排序字段为第一步查出来的最后一条数据(也就是第10000条数据)的排序字段

    GET /user_info/_search
    {
    "size": 10000,
    "sort": [{
    "name": {
    "order": "asc"
    }
    },
    {
    "birthDay": {
    "order": "desc"
    }
    }],
    "search_after": ["wang", "1993-12-01"]
    }

java代码

复制代码
    public SearchSourceBuilder searchAfterTest() {
        SearchSourceBuilder searc = new SearchSourceBuilder().size(10000);

        BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();
//        boolQuery.filter(QueryBuilders.termQuery("province", "深圳市"));

        searc.sort("name", SortOrder.ASC).sort("birthDay", SortOrder.DESC);

        String[] searchAfter = new String[]{"wang", "1993-12-01"};
        searc.searchAfter(searchAfter);

        return searc.query(boolQuery);
    }
相关推荐
尽兴-1 小时前
Elasticsearch Query DSL 进阶:高频查询范式与实战排坑
大数据·elasticsearch·jenkins·向量检索·去哪嗯检索·模糊匹配·地理空间查询
Elasticsearch11 小时前
使用 TypeScript 创建 Elasticsearch MCP 服务器
elasticsearch
Elastic 中国社区官方博客12 小时前
Elasticsearch BBQ:一场教科书式的向量搜索 “弯道超车”
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
终端行者14 小时前
Elasticsearch介绍集群迁移 Es集群如何迁移
大数据·elasticsearch·搜索引擎
未来转换14 小时前
Java 21 + Spring Boot + Elasticsearch 8.10 实现语义搜索
java·开发语言·spring boot·后端·elasticsearch·ai·图搜索算法
尽兴-14 小时前
ElasticSearch 聚合操作详解(含实战示例 + 精度优化 + 性能调优)
大数据·elasticsearch·搜索引擎·桶聚合·指标聚合·管道聚合
KANGBboy1 天前
ES 父子索引使用
大数据·elasticsearch·搜索引擎
墨神谕1 天前
ES为什么要进行分片
大数据·elasticsearch·搜索引擎
Elasticsearch1 天前
Elasticsearch BBQ:一场教科书式的向量搜索 “弯道超车”
elasticsearch
尽兴-1 天前
ElasticSearch 搜索相关性详解(含评分机制+自定义策略+多字段优化)
大数据·elasticsearch·搜索引擎·相关性·评分机制·自定义策略·多字段优化