ES分页问题

Fuly10242024-02-14 21:12

分页方式3种

from + size 浅分页
其中，from定义了目标数据的偏移值，size定义当前返回的数目。默认from为0，size为10，即所有的查询默认仅仅返回前10条数据。越往后查询效率越低; 5w条以内勉强可用;
如果搜索size大于10000，需要设置index.max_result_window参数

PUT _settings
{
"index": {
"max_result_window": "10000000"
}
}
scroll 深分页,
滚动读取, 相当于创建一个索引快照,然后按照索引依次去查询;

GET test_dev/_search?scroll=5m
{
"query": {
"bool": {
"filter": [
{
"term": {
"age": 28
}
}
]
}
},
"size": 10,
"from": 0,
"sort": [
{
"timestamp": {
"order": "desc"
},
"_id": {
"order": "desc"
}
}
]
}

scroll=5m表示设置scroll_id保留5分钟可用。

使用scroll必须要将from设置为0。

size决定后面每次调用_search搜索返回的数量;

然后我们可以通过数据返回的_scroll_id读取下一页内容，每次请求将会读取下10条数据，直到数据读取完毕或者scroll_id保留时间截止;

缺点:

① 不能跳页读取,只能顺序读取;

②历史快照,不能查询实时数据;

③scroll_id会占用大量的资源,尤其是排序(用完后要记得删除)

2.2 Scroll Scan 的遍历与普通 Scroll 一样，初始化存在一点差别,但没有排序功能;

Scroll-Scan结果没按index顺序返回，没有排序，可以提高取数据性能。

2.3 Sliced Scroll 切片并发, 与Scroll Scan类似只是进行切片,然后并发执行;

Search After (ES5之后才有的)
search_after 分页的方式是根据上一页的最后一条数据来确定下一页的位置，同时在分页请求的过程中，如果有索引数据的增删改查，这些变更也会实时的反映到游标上。但是需要注意，因为每一页的数据依赖于上一页最后一条数据，所以无法跳页请求。这就要求每个文档必须有一个全局唯一值

参考: https://juejin.cn/post/7092046739414204430

上一篇：93 log4j-slf4j-impl 搭配上 log4j-to-slf4j 导致的 StackOverflow

下一篇：Elasticsearch中的动态DSL解决方案

热门推荐

0100 Debian字符界面如何支持中文 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）052026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 06微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 092026开年大模型最新对比解析及场景落地指南 10历年考研数学一、数学二、数学三真题试卷及答案PDF