【DevOps】Elasticsearch集群JVM参数调整及滚动重启指南

目录

概述

准备工作

滚动重启步骤

[1. 禁用分片分配(可选)](#1. 禁用分片分配(可选))

[2. 关闭索引写操作](#2. 关闭索引写操作)

[3. 检查集群状态](#3. 检查集群状态)

[4. 重启Master节点](#4. 重启Master节点)

[5. 重启Data节点](#5. 重启Data节点)

[6. 重新开启索引写操作](#6. 重新开启索引写操作)

[7. 启用分片分配(如果之前禁用了)](#7. 启用分片分配(如果之前禁用了))

[8. 监控集群状态](#8. 监控集群状态)

结论


概述

本文档旨在提供一个详细的指南,帮助用户在Elasticsearch集群中调整JVM参数并进行滚动重启。滚动重启是一种逐步重启集群节点的方法,旨在最小化对集群性能和可用性的影响。Elasticsearch集群的环境包括3台master节点,三台data节点。下面我们看一下具体实现步骤。

准备工作

  1. 备份配置文件

    在每个节点上备份jvm.options文件。

    复制代码
    cp /etc/elasticsearch/jvm.options /etc/elasticsearch/jvm.options.backup
  2. 修改JVM参数

    编辑每个节点的/etc/elasticsearch/jvm.options文件,调整所需的JVM参数。例如,调整堆内存大小:

    复制代码
    -Xms4g
    -Xmx4g

滚动重启步骤

1. 禁用分片分配(可选)

在任意一个Master节点上执行以下命令,禁用分片分配:

复制代码
curl -X PUT "http://localhost:9200/_cluster/settings" -H 'Content-Type: application/json' -d'
{
  "persistent": {
    "cluster.routing.allocation.enable": "primaries"
  }
}'

2. 关闭索引写操作

在任意一个Master节点上执行以下命令,关闭所有索引的写操作:

复制代码
curl -X PUT "http://localhost:9200/_all/_settings" -H 'Content-Type: application/json' -d'
{
  "index.blocks.write": true
}'

3. 检查集群状态

确保集群状态为黄色或绿色,等待所有分片被分配:

复制代码
curl -X GET "http://localhost:9200/_cluster/health?wait_for_status=yellow&timeout=30s"

4. 重启Master节点

依次重启每个Master节点,确保每次重启后集群保持稳定。

  • 重启Master节点1

    复制代码
    sudo systemctl restart elasticsearch
  • 检查节点状态

    复制代码
    curl -X GET "http://localhost:9200/_cat/nodes"
  • 等待节点加入集群

    确保Master节点1成功加入集群并状态正常。

  • 重启Master节点2

    复制代码
    sudo systemctl restart elasticsearch
  • 检查节点状态

    复制代码
    curl -X GET "http://localhost:9200/_cat/nodes"
  • 等待节点加入集群

    确保Master节点2成功加入集群并状态正常。

  • 重启Master节点3

    复制代码
    sudo systemctl restart elasticsearch
  • 检查节点状态

    复制代码
    curl -X GET "http://localhost:9200/_cat/nodes"
  • 等待节点加入集群

    确保Master节点3成功加入集群并状态正常。

5. 重启Data节点

依次重启每个Data节点,确保每次重启后集群保持稳定。

  • 重启Data节点1

    复制代码
    sudo systemctl restart elasticsearch
  • 检查节点状态

    复制代码
    curl -X GET "http://localhost:9200/_cat/nodes"
  • 等待节点加入集群

    确保Data节点1成功加入集群并状态正常。

  • 重启Data节点2

    复制代码
    sudo systemctl restart elasticsearch
  • 检查节点状态

    复制代码
    curl -X GET "http://localhost:9200/_cat/nodes"
  • 等待节点加入集群

    确保Data节点2成功加入集群并状态正常。

  • 重启Data节点3

    复制代码
    sudo systemctl restart elasticsearch
  • 检查节点状态

    复制代码
    curl -X GET "http://localhost:9200/_cat/nodes"
  • 等待节点加入集群

    确保Data节点3成功加入集群并状态正常。

6. 重新开启索引写操作

在任意一个Master节点上执行以下命令,重新开启所有索引的写操作:

复制代码
curl -X PUT "http://localhost:9200/_all/_settings" -H 'Content-Type: application/json' -d'
{
  "index.blocks.write": false
}'

7. 启用分片分配(如果之前禁用了)

在所有节点重启完成后,重新启用分片分配:

复制代码
curl -X PUT "http://localhost:9200/_cluster/settings" -H 'Content-Type: application/json' -d'
{
  "persistent": {
    "cluster.routing.allocation.enable": "all"
  }
}'

8. 监控集群状态

在重启完成后,持续监控集群的健康状态和性能指标,确保一切正常。

结论

通过以上步骤,你可以在Elasticsearch集群中安全地调整JVM参数并进行滚动重启。请确保在操作过程中谨慎行事,并持续监控集群状态,以确保集群的稳定性和性能。

相关推荐
爱学习的阿磊11 分钟前
Python迭代器(Iterator)揭秘:for循环背后的故事
jvm·数据库·python
明月(Alioo)32 分钟前
重新认识JVM的内存分布(JDK11 + G1垃圾收集器)
jvm
TracyCoder12343 分钟前
ElasticSearch核心引擎Apache Lucene(四):段 (Segment) 的设计与合并
elasticsearch·apache·lucene
BUTCHER51 小时前
elasticsearch时间搜索
大数据·elasticsearch·jenkins
野生技术架构师1 小时前
深度拆解JVM垃圾回收:可达性分析原理+全类型回收器执行机制
java·开发语言·jvm
yufuu981 小时前
Python在金融科技(FinTech)中的应用
jvm·数据库·python
OnYoung1 小时前
持续集成/持续部署(CI/CD) for Python
jvm·数据库·python
2301_822377651 小时前
高级爬虫技巧:处理JavaScript渲染(Selenium)
jvm·数据库·python
u0109272711 小时前
用Python和Twilio构建短信通知系统
jvm·数据库·python
闻哥1 小时前
从 SQL 执行到优化器内核:MySQL 性能调优核心知识点解析
java·jvm·数据库·spring boot·sql·mysql·面试