ES分页问题

分页方式3种

  1. from + size 浅分页
    其中,from定义了目标数据的偏移值,size定义当前返回的数目。默认from为0,size为10,即所有的查询默认仅仅返回前10条数据。越往后查询效率越低; 5w条以内勉强可用;
    如果搜索size大于10000,需要设置index.max_result_window参数

    PUT _settings
    {
    "index": {
    "max_result_window": "10000000"
    }
    }

  2. scroll 深分页,
    滚动读取, 相当于创建一个索引快照,然后按照索引依次去查询;

    GET test_dev/_search?scroll=5m
    {
    "query": {
    "bool": {
    "filter": [
    {
    "term": {
    "age": 28
    }
    }
    ]
    }
    },
    "size": 10,
    "from": 0,
    "sort": [
    {
    "timestamp": {
    "order": "desc"
    },
    "_id": {
    "order": "desc"
    }
    }
    ]
    }

scroll=5m表示设置scroll_id保留5分钟可用。

使用scroll必须要将from设置为0。

size决定后面每次调用_search搜索返回的数量;

然后我们可以通过数据返回的_scroll_id读取下一页内容,每次请求将会读取下10条数据,直到数据读取完毕或者scroll_id保留时间截止;

缺点:

① 不能跳页读取,只能顺序读取;

②历史快照,不能查询实时数据;

③scroll_id会占用大量的资源,尤其是排序(用完后要记得删除)

2.2 Scroll Scan 的遍历与普通 Scroll 一样,初始化存在一点差别,但没有排序功能;

Scroll-Scan结果没按index顺序返回,没有排序,可以提高取数据性能。

2.3 Sliced Scroll 切片并发, 与Scroll Scan类似只是进行切片,然后并发执行;

  1. Search After (ES5之后才有的)
    search_after 分页的方式是根据上一页的最后一条数据来确定下一页的位置,同时在分页请求的过程中,如果有索引数据的增删改查,这些变更也会实时的反映到游标上。但是需要注意,因为每一页的数据依赖于上一页最后一条数据,所以无法跳页请求。 这就要求每个文档必须有一个全局唯一值

参考: https://juejin.cn/post/7092046739414204430

相关推荐
Miha_Singh25 分钟前
查询优化综述:《A Survey of Query Optimization in Large Language Models》
数据库·人工智能·语言模型·查询优化·查询改写
打工的小王36 分钟前
Redis(一)redis的下载安装与使用
数据库·redis·缓存
煎蛋学姐1 小时前
SSM医患交流m8996(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面
数据库·ssm 框架·医患交流系统
麦聪聊数据1 小时前
为何“零信任”时代需要重构数据库访问层?
数据库·sql
DBA小马哥1 小时前
InfluxDB迁移?时序数据库国产替代三大难点与实践
数据库·时序数据库
LYOBOYI1231 小时前
qml程序运行逻辑
java·服务器·数据库
袁煦丞 cpolar内网穿透实验室2 小时前
mysql_exporter+cpolar远程监控 MySQL 不卡壳!cpolar 内网穿透实验室第 712 个成功挑战
服务器·数据库·mysql·远程工作·内网穿透·cpolar
Mikhail_G2 小时前
Mysql数据库操作指南(零基础篇二)
大数据·数据库·sql·mysql·数据分析
一条大祥脚2 小时前
26.1.24 分块|排序|中位数贪心+线段树二分+聚集贪心
数据库·redis·缓存
Anastasiozzzz2 小时前
Redis脑裂问题--面试坑点【Redis的大脑裂开?】
java·数据库·redis·缓存·面试·职场和发展