Elasticsearch(ES) 配置建议

Elasticsearch的内存建议设置为32GB以下,‌主要是因为Java虚拟机(‌JVM)‌在内存小于32G时会采用内存对象指针压缩技术,‌以提高内存使用效率。‌这种技术通过压缩对象指针,‌使得32位的指针可以引用40亿个对象,‌而不是40亿个字节,‌从而在堆内存达到32G时,‌仍然能够使用32bit的指针表示。‌然而,‌一旦内存超过这个界限,‌指针将切换到普通对象的指针,‌这将导致每个对象的指针变长,‌从而浪费更多的CPU和内存带宽,‌降低性能。‌此外,‌当JVM的内存设置为32GB以上时,‌实际使用的内存效果会下降,‌因为压缩下的对象会比未压缩的要小一些,‌正常是20-30%的差异。‌因此,‌为了效率和性能的考虑,‌建议将Elasticsearch的内存设置在32GB以下。

尽管内存充足,也应避免超过32GB的使用,以免浪费资源、降低CPU效率,并增加垃圾回收(GC)的负担。

推荐配置:

|-----|-----------|-------------|-------------------------|
| 日志类 | 特点 | 磁盘 | 集群节点数 |
| 搜索类 | 写入较少,查询频繁 | 单个分片不超过20G | 1:16 (内存:节点要存储的数据) |
| 日志类 | 写入频繁,查询较少 | 单个分片不要大于50G | 1:48-1:96 (内存:节点要存储的数据) |
| 冷节点 | 写入较少,查询较少 | | 1:96 |

对于数据量较小(100GB以下)的index

  • 往往写入压力查询压力相对较低,一般设置3~5个shard,numberofreplicas设置为1即可(也就是一主一从,共两副本)。

对于数据量较大(100GB以上)的index:

  • 一般把单个shard的数据量控制在(20GB~50GB)
  • 让index压力分摊至多个节点:可通过下面的参数来强制限定一个节点上该index的shard数量,让shard尽量分配到不同节点上。参数:
  • index.routing.allocation.totalshardsper_node
相关推荐
代码匠心2 天前
从零开始学Flink:Flink SQL四大Join解析
大数据·flink·flink sql·大数据处理
武子康3 天前
大数据-242 离线数仓 - DataX 实战:MySQL 全量/增量导入 HDFS + Hive 分区(离线数仓 ODS
大数据·后端·apache hive
Elasticsearch3 天前
需要知道某个同义词是否实际匹配了你的 Elasticsearch 查询吗?
elasticsearch
SelectDB4 天前
易车 × Apache Doris:构建湖仓一体新架构,加速 AI 业务融合实践
大数据·agent·mcp
武子康4 天前
大数据-241 离线数仓 - 实战:电商核心交易数据模型与 MySQL 源表设计(订单/商品/品类/店铺/支付)
大数据·后端·mysql
IvanCodes4 天前
一、消息队列理论基础与Kafka架构价值解析
大数据·后端·kafka
武子康5 天前
大数据-240 离线数仓 - 广告业务 Hive ADS 实战:DataX 将 HDFS 分区表导出到 MySQL
大数据·后端·apache hive
洛森唛6 天前
ElasticSearch查询语句Query String详解:从入门到精通
后端·elasticsearch
字节跳动数据平台6 天前
5000 字技术向拆解 | 火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
武子康6 天前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive