【面试】Elasticsearch 在部署时,对 Linux 的设置有哪些优化方法?

Elasticsearch 在部署时,对 Linux 的设置有哪些优化方法?

Elasticsearch是一个分布式搜索和分析引擎,它在Linux环境下的性能和稳定性可以通过一些优化方法进行提升。以下是一些针对Linux环境下Elasticsearch部署的优化方法:

1. 内存配置:
   - 推荐使用64GB内存的机器,但32GB和16GB的机器也是常见的选择。少于8GB的内存可能会导致性能下降。
   - 如果有选择更快的CPU和更多的核心,选择更多的核心会更好。多个核心提供的并发能力比稍微更快的时钟频率更重要。


2. 存储选择:
   - 使用SSD(固态硬盘)可以获得更好的性能。基于SSD的节点可以提升查询和索引的性能。如果经济条件允许,SSD是一个不错的选择。

3. 集群布局:
   - 避免跨越多个数据中心的集群部署,尽量避免跨大的地理距离。


4. JVM设置:
   - 确保运行应用程序的JVM和服务器上运行的JVM完全相同。在Elasticsearch中使用Java的本地序列化。

5. 集群重启优化:
   - 通过设置`gateway.recover_after_nodes`、`gateway.expected_nodes`、`gateway.recover_after_time`参数,可以在集群重启时避免过多的分片交换,从而缩短数据恢复的时间。

6. 节点发现:
   - Elasticsearch默认使用单播(unicast)发现,以防止节点意外加入集群。只有在同一台机器上运行的节点才会自动组成集群。建议使用单播而不是组播(multicast)。

7. 垃圾回收器和线程池:
   - 不建议随意修改垃圾回收器(CMS)和各个线程池的大小。

8. 内存设定:
   - 通过设置环境变量`ES_HEAP_SIZE`,将内存的一半分配给Lucene(但不超过32GB)。

9. 避免内存交换:
   - 内存交换到磁盘会对服务器性能产生严重影响。确保避免内存交换到磁盘,因为交换操作会导致延迟增加,严重影响性能。

10. 文件描述符:
    - Lucene使用大量文件,而Elasticsearch在节点和HTTP客户端之间的通信也使用大量套接字。确保服务器具有足够的文件描述符,可以增加文件描述符的数量,例如设置为64,000。

补充:索引阶段性能提升方法:

1. 使用批量请求并调整其大小:
   - 使用批量请求可以提高性能,根据情况调整每个批量的大小,通常在5-15MB之间。

2. 存储选择:
   - 使用SSD可以提升索引阶段的性能。

3. 段和合并:
   - 调整合并速率,对于机械硬盘,可以使用默认的20MB/s设置。如果使用SSD,可以考虑增加到100-200MB/s。对于批量导入,可以完全关闭合并限流。还可以增加`index.translog.flush_threshold_size`设置,将默认的512MB增加到更大的值,例如1GB,这样可以在一次清空触发时在事务日志中积累更大的段。

4. 刷新间隔:
   - 如果搜索结果不需要近实时的准确性,可以将每个索引的`index.refresh_interval`设置为30秒
5. 关闭副本:
   - 对于大规模批量导入,可以通过设置`index.number_of_replicas: 0`关闭副本,以提高性能。

以上是在部署Elasticsearch时针对Linux环境的一些优化方法。根据实际情况和需求,可以选择适合的优化策略来提升性能和稳定性。

相关推荐
程序猿进阶28 分钟前
堆外内存泄露排查经历
java·jvm·后端·面试·性能优化·oom·内存泄露
长风清留扬2 小时前
一篇文章了解何为 “大数据治理“ 理论与实践
大数据·数据库·面试·数据治理
Mephisto.java2 小时前
【大数据学习 | Spark】Spark的改变分区的算子
大数据·elasticsearch·oracle·spark·kafka·memcache
mqiqe2 小时前
Elasticsearch 分词器
python·elasticsearch
小马爱打代码2 小时前
Elasticsearch简介与实操
大数据·elasticsearch·搜索引擎
java1234_小锋11 小时前
Elasticsearch是如何实现Master选举的?
大数据·elasticsearch·搜索引擎
周三有雨13 小时前
【面试题系列Vue07】Vuex是什么?使用Vuex的好处有哪些?
前端·vue.js·面试·typescript
爱米的前端小笔记14 小时前
前端八股自学笔记分享—页面布局(二)
前端·笔记·学习·面试·求职招聘
好学近乎知o14 小时前
解决sql字符串
面试
梦幻通灵17 小时前
ES分词环境实战
大数据·elasticsearch·搜索引擎