Elasticsearch出现深度分页问题怎么解决？

Elasticsearch 的深度分页问题，本质上是 from + size 查询方式在处理海量数据时，系统资源消耗会随分页深度线性甚至指数级增长。这主要体现在协调节点需要从所有分片拉取并排序远超所需的数据，导致协调节点内存压力大，甚至引发内存溢出（OOM）。

Elasticsearch 默认设置了 max_result_window 为 10,000，就是为了防止随意调整导致集群不稳定。

简单来说，from + size 查询为了返回第 1000 页的 10 条数据，需要先"吃力不讨好"地收集、排序并丢弃掉前 9990 条数据，这在分布式系统中开销巨大。

针对不同场景，Elasticsearch 提供了几种高效的替代方案：

方案	核心机制	适用场景	关键限制
Search After	基于上一页文档的排序值，像"书签"一样精准定位下一页起始点。	用户实时交互分页（如"加载更多"），需要看最新数据且性能稳定的场景。	不支持随机跳页，需顺序翻页。
Scroll API	首次查询时生成一份数据"快照"（Snapshot），之后通过游标（Scroll ID）批量获取。	非实时的大批量数据处理：数据导出、数据迁移、索引重建（Reindex）等后台任务。	数据不实时（基于快照）；会占用大量资源，用后必须手动清理。
PIT + Search After	先用 Point In Time API 锁定一个时间点的索引视图，再进行 Search After 查询。	分页期间索引有大量更新，但要求分页结果视图一致性的场景。	使用略复杂，需管理 PIT 的生命周期。

如果你能分享一下具体的业务场景（例如是"用户交互"还是"数据导出"），我可以帮你做更具体的方案选型～