ES实战回顾

1、你用的集群节点情况?

一个ES集群,18个节点,其中3个主节点,15个数据节点,500G左右的索引数据量,没有单独的协调节点,它的每个节点都可以充当协调功能;

2、你们常用的索引有哪些?

业务监控、搜索sug功能、B/M端的一些,业务历史数据,业务单等

3、这些索引怎么配置的高可用?

根据数据量设置分片(3、5个都有),并设置1个副本(副本无需过多,多了要同步,也会影响性能)

4、如何做索引优化的?

(1)夜里低峰期触发 定时任务:段合并

(2)按照日期建立索引,索引模版+用别名来查询多个索引

(3)定时任务:停用/删除索引

(4)copy_to 先term精确查,结果集不够的话再 match模糊查询

5、段合并是什么东西?

ES的倒排索引文件是存在segment中,segment是存在内存中,由于每次refresh都会生产新的segment,如果segment过多会消耗较大内存,定期进行段合并有几个好处:

(1)减少内存消耗,合并段的同时会释放已删除的索引空间,业务如果使用delete by id进行索引删除,es只是把数据标记为已删除,并没有释放空间,在segment合并时会把这些数据进行清理

(2)加快查询性能,每次搜索请求都需要依次检查每个段。段越多,查询越慢。


相关推荐
派可数据BI可视化14 小时前
一文读懂系列:数据仓库为什么分层,分几层?数仓建模方法有哪些
大数据·数据仓库·信息可视化·spark·商业智能bi
Light6014 小时前
不止于名:领码 SPARK 如何“链”动数据仓库、数据湖、中台与湖仓一体新纪元
大数据·数据仓库·数据湖·ipaas·湖仓一体·数据中台·领码 spark
郑小憨14 小时前
FlinkSQL窗口函数TUMBLE、SESSION 和 HOP的区别
大数据·数据仓库·sql·flink·database
码字的字节14 小时前
锚点模型:数据仓库中的高度可扩展建模技术详解
大数据·数据仓库·spark
Agentic AI人工智能与大数据14 小时前
大数据领域数据仓库的ETL任务优化
大数据·数据仓库·ai·etl
AI软件工程实践14 小时前
解读大数据领域数据仓库的事实表设计
大数据·数据仓库·ai
Zzz 小生15 小时前
LangChain Tools:工具使用完全指南
jvm·数据库·oracle
SQL必知必会15 小时前
SQL 计算百分位数和中位数
数据库·sql
亓才孓16 小时前
[SpringBoot]UnableToConnectException : Public Key Retrieval is not allowed
java·数据库·spring boot
好学且牛逼的马16 小时前
从“混沌初开”到“有序统一”:Java集合框架发展历程与核心知识点详解
前端·数据库·python