elasticSearch常见的面试题

常见的面试问题

es集群架构3个节点，根据不同的服务创建不同的索引，根据日期和环境，平均每天递增60*2，大约60Gb的数据。

原文参考：干货 | BAT等一线大厂 Elasticsearch面试题解读 - 掘金

定义条件，生成新的索引，但都指向一个别名

合并Lucene索引在每个分片中保存的分段数，强制合并减少分片中的分段数量

删除副本，只读索引，减少主分片的数量

对索引和快照进行管理，配置规则，定时任务调用

默认情况下索引的refresh_interval为1秒,这意味着数据写1秒后就可以被搜索到,每次索引的 refresh 会产生一个新的 lucene 段,这会导致频繁的 segment merge 行为,如果你不需要这么高的搜索实时性,应该降低索引refresh 周期

写入 doc 时如果是外部指定了 id,es 会先尝试读取原来doc的版本号, 判断是否需要更新,使用自动生成 doc id 可以避免这个环节

基于模板+时间+rollover api 滚动创建索引

冷热数据分离存储，冷数据force_merge+shrink压缩

合理的前期规划，动态增加节点缓解集群压力

文档id计算目标分片id

Java 复制代码

shard = hash(_routing) % (num_of_primary_shards)