elasticsearch的常见面试题？

在面试过程中除去各个公司的不同服务架构之外，也会存在一些普遍大众的面试点，以下将会从三个维度进行介绍。

基础知识类

具体来说：

每个词对应一个词典项，词典项中包含了改词的所有文档列表，以及每个文档中改词出现的频率、位置等信息。当用户进行搜索时，elasticsearch会根据查询在词典中查找对应的文档列表，从而快速定位包含该词的文档，从而提高效率。

bash 复制代码

curl -X GET "localhost:9200/_cluster/health"|jq

主分片 ：每个索引的文档都会被分配到一个主分片中，主分片负责存储实际的数据。
- 一个索引可以有多个主分片，主分片的数量在索引创建时确定，并且不能更改。
- 主分片的数量应根据预计的数据量和集群的节点容量来确定，建议：主分片数量最多不要超过集群中节点的数量，避免单个节点分配过多主分片而造成资源紧张。
副本分片 ：为主分片的副本，用于高可用性和容错性。
- 当某个主分片所在的节点发生故障时，副本分片可以提升为主分片继续提供服务。同时也能够分担读请求，提高搜索和查询效率。
- 副本分片的数量可以在索引创建后动态调整。

text 复制代码

案例：在不影响业务的情况下最多可以容忍几台服务器宕机？
如果你要容忍N台服务器故障，集群需要2N+1台服务器，故高可用集群都采用奇数台服务器。
1）5台服务器的最大允许宕机服务器数是多少？
2n+1=5---->n=2
2）6台服务器的最大允许宕机服务器数是多少？
2n+1=6---->n=2

使用elasticsearch自带的监控API ：
- /_cat：API可以用于获取集群、节点、索引等基本信息。
- _cat/indices：查看索引的健康状态、文档数量、存储大小。
- _cat/nodes：查看节点的状态、CPU使用率、内存使用率等。
- _nodes/status：获取节点的详细统计信息（含索引、分片、缓存、线程池等）。
第三方监控工具 ：Prometheus + Grafana。
- prometheus可以收集elasticsearch的各种指标数据，包含JVM堆内存使用率、索引和搜索的吞吐量、分片分配情况等。
- 通过Grafana可视化这些数据，及时发现潜在的性能瓶颈和问题。

合理设置索引的分片和副本数量 ：
- 根据数据量和集群资源合理配置主分片数和副本数，避免分片过多或过少。
优化查询语句 ：
- 采用更高效的查询方式。
- 例如避免使用通配符查询（如*）开头的查询方式。
调整java堆内存大小 ：
- elasticsearch运行在jvm上，适当的堆内存大小对性能至关重要。
- 通常建议将堆内存大小设置为系统物理内存的一半即可。且不超过32GB，避免降低性能。
硬件升级和优化 ：
- 对于高并发、大数据量的场景，可以通过增加节点、升级服务器硬件（如，CPU\内存\SSD磁盘等）来提升集群的整体性能。

收集故障信息 ：
- 查看elasticsearch的日志文件，日志文件通常位于logs目录下，所以从中获取节点故障的错误信息、异常堆栈等，初步判断故障原因。
- 使用curl -X GET "localhost:9200/_cluster/health"|jq查看集群健康状态，确保集群状态为red的具体原因（如主分片未分配等）。
检查节点连接和网络状况 ：
- 确认故障节点是否可以正常通信，检查网络连接是否正常，是否有网络分区或其他网络故障导致节点无法通信。
- 可通过ping命令测试节点之间的连通性，或使用telnet测试节点间的端口是否开放。
检查硬件资源 ：
- 查看故障节点的CPU、内存、磁盘等硬件资源使用情况，是否存在资源被耗尽的情况。
- 采用top/free -m/df -h等命令查看硬件资源状态。
根据故障原因进行恢复操作 ：
- 节点硬件故障（磁盘损坏）：更换硬件并更新启动节点。
- 网络故障：修复网络连接后，集群会自动进行数据恢复和分片分配。
- 主分片未分配：根据具体情况，如增加副本数、调整分片分配策略等来解决。