ElasticSearch 常用查询优化方式

设计阶段调优
1: 根据业务增量需求,采取基于日期模板创建索引,通过 roll over API 滚动索引;
2: 使用别名进行索引管理;
3: 每天凌晨定时对索引做 force_merge 操作,以释放空间;
4: 采取冷热分离机制,热数据存储到 SSD,提高检索效率;冷数据定期进行 shrink操作,以缩减存储;
5: 采取 curator 进行索引的生命周期管理;
6: 仅针对需要分词的字段,合理的设置分词器;
7: Mapping 阶段充分结合各个字段的属性,是否需要检索、是否需要存储等。

写入调优
1: 写入前副本数设置为 0;
2: 写入前关闭 refresh_interval 设置为-1,禁用刷新机制;
3: 写入过程中:采取 bulk 批量写入;
4: 写入后恢复副本数和刷新间隔;
5: 尽量使用自动生成的 id。

查询调优
1: 禁用 wildcard;
2: 禁用批量 terms(成百上千的场景);
3: 充分利用倒排索引机制,能 keyword 类型尽量 keyword;
4: 数据量大时候,可以先基于时间敲定索引再检索;
5: 设置合理的路由机制。

其他调优

部署调优,业务调优等。

相关推荐
神秘打工猴7 小时前
Spark和Mapreduce对比
大数据·spark·mapreduce
写代码的橘子n7 小时前
MapReduce相关概念(自用)
大数据·mapreduce
ueanaIU潇潇子8 小时前
Linux系统安装es详细教程
linux·运维·elasticsearch
qiquandongkh12 小时前
期权懂|期权都有哪些存在的风险因素?
大数据·区块链
hengzhepa13 小时前
ElasticSearch备考 -- 整体脉络梳理
大数据·elasticsearch·搜索引擎
神秘打工猴13 小时前
Spark基本介绍
大数据·分布式·spark
奥顺13 小时前
八字算命网站搭建方法:从零开始用php搭建一个命理网
大数据·mysql·开源·php
Data-Miner14 小时前
某制造集团灯塔工厂解决方案(36页PPT)
大数据
隔着天花板看星星14 小时前
Structured-Streaming集成Kafka
大数据·分布式·spark·kafka