ES实战回顾

1、你用的集群节点情况?

一个ES集群,18个节点,其中3个主节点,15个数据节点,500G左右的索引数据量,没有单独的协调节点,它的每个节点都可以充当协调功能;

2、你们常用的索引有哪些?

业务监控、搜索sug功能、B/M端的一些,业务历史数据,业务单等

3、这些索引怎么配置的高可用?

根据数据量设置分片(3、5个都有),并设置1个副本(副本无需过多,多了要同步,也会影响性能)

4、如何做索引优化的?

(1)夜里低峰期触发 定时任务:段合并

(2)按照日期建立索引,索引模版+用别名来查询多个索引

(3)定时任务:停用/删除索引

(4)copy_to 先term精确查,结果集不够的话再 match模糊查询

5、段合并是什么东西?

ES的倒排索引文件是存在segment中,segment是存在内存中,由于每次refresh都会生产新的segment,如果segment过多会消耗较大内存,定期进行段合并有几个好处:

(1)减少内存消耗,合并段的同时会释放已删除的索引空间,业务如果使用delete by id进行索引删除,es只是把数据标记为已删除,并没有释放空间,在segment合并时会把这些数据进行清理

(2)加快查询性能,每次搜索请求都需要依次检查每个段。段越多,查询越慢。


相关推荐
忧郁的橙子.3 分钟前
02-嵌入模型和向量数据库
数据库·embedding
Lalolander29 分钟前
从“大海捞针”到“秒级定位”:破解工厂质量追溯困局的系统性路径
大数据·mes·制造执行系统·工厂管理软件·工厂管理系统
读创商闻30 分钟前
2026主流商旅平台Top 5测评与选型解析:制造业企业的商旅治理逻辑
大数据·人工智能
kaoa00037 分钟前
Linux入门攻坚——67、MySQL数据库-4
linux·运维·数据库·mysql
学Linux的语莫1 小时前
skills的使用
java·数据库·python
码云数智-园园1 小时前
MySQL 性能调优实战:高效处理 ORDER BY 与 GROUP BY 查询
数据库·mysql
大模型玩家七七1 小时前
关系记忆不是越完整越好:chunk size 的隐性代价
java·前端·数据库·人工智能·深度学习·算法·oracle
Elastic 中国社区官方博客1 小时前
Elasticsearch:使用 Workflow 查询天气,发送消息到 Slack
大数据·运维·人工智能·elasticsearch·搜索引擎·ai
康康的AI博客1 小时前
AI技术驱动电商内容与策略优化:如何提升客户参与度与品牌价值
大数据·人工智能
全栈前端老曹1 小时前
【Redis】Pipeline 与性能优化——批量命令处理、提升吞吐量、减少网络延迟
前端·网络·数据库·redis·缓存·性能优化·全栈