Elasticsearch 节点角色详解及协调节点请求策略

引言

Elasticsearch 集群中的节点可以承担多种角色,如主节点、数据节点、预处理节点和协调节点。合理配置和理解这些节点角色,对于保障集群的高可用性、性能优化以及请求调度至关重要。本文将深入解析各类节点的职责与配置方式,并介绍如何通过客户端实现请求只发送到协调节点的实践方法,帮助您更好地设计与运维 Elasticsearch 集群架构。

节点种类

一个节点可以同时扮演多个角色,包括 Master Node、Data Node、Coordinating Node 和 Ingest Node。事实上,默认情况下,Elasticsearch 中的所有节点通常都是多角色节点(三个配置默认值都为true),即它们可以同时充当 Master Node、Data Node、Coordinating Node 和 Ingest Node 的角色。这种多角色的配置可以在小规模集群中简化架构,并且在资源有限的情况下有效利用每个节点的能力。

一个节点同时是Master Node、Data Node、Ingest Node。

复制代码
node.master: true
node.data: true
node.ingest: true

主节点(Master Node)

负责管理集群的状态,包括节点的加入和离开、索引的创建和删除、分片的分配和重分配等。建议配置至少三个 Master Node 作为候选主节点以确保高可用性,一个 ES 集群只能有一个主节点。

复制代码
node.master: true
node.data: false
node.ingest: false

数据节点(Data Node)

存储实际的数据,并处理所有数据相关的操作,如文档的创建、更新、删除,以及搜索和聚合请求。

复制代码
node.master: false
node.data: true
node.ingest: false

预处理节点(Ingest Node)

通过预处理管道(Ingest Pipeline)在文档被索引之前对其进行各种处理,例如添加字段、删除字段、修改字段值等。当使用Ingest Pipelines时,Elasticsearch会将文档发送到Ingest Node。

复制代码
node.master: false
node.data: false
node.ingest: true

协调节点(Coordinating Node)

接收来自客户端的请求,并将这些请求进行请求接收与分发、查询合并以及负载均衡等功能。

复制代码
node.master: false
node.data: false
node.ingest: false

如何能让请求只发送到协调节点?

如果想请求只发送到协调节点,可以通过RestHighLevelClient创建客户端时指定节点,客户端会轮询这些节点进行请求来实现。

复制代码
// 创建RestHighLevelClient实例,连接到Elasticsearch集群中的多个节点
RestHighLevelClient client = new RestHighLevelClient(
    RestClient.builder(
        new HttpHost("node1.example.com", 9200, "http"), // 集群中的第一个节点
        new HttpHost("node2.example.com", 9200, "http"), // 集群中的第二个节点
        new HttpHost("node3.example.com", 9200, "http")  // 集群中的第三个节点
    )
);

注:官方说,协调节点最好不要单独分离出来,跟数据节点在一起就行。分离开的意义不大。


感谢您的阅读!如果文章中有任何问题或不足之处,欢迎及时指出,您的反馈将帮助我不断改进与完善。期待与您共同探讨技术,共同进步!

相关推荐
翰林小院15 小时前
【大数据专栏】流式处理框架-Apache Fink
大数据·flink
孟意昶16 小时前
Spark专题-第一部分:Spark 核心概述(2)-Spark 应用核心组件剖析
大数据·spark·big data
一路向北North16 小时前
lucene渲染未命中最匹配的关键词和内容
搜索引擎·全文检索·lucene
IT学长编程17 小时前
计算机毕业设计 基于Hadoop的健康饮食推荐系统的设计与实现 Java 大数据毕业设计 Hadoop毕业设计选题【附源码+文档报告+安装调试】
java·大数据·hadoop·毕业设计·课程设计·推荐算法·毕业论文
AAA修煤气灶刘哥17 小时前
Kafka 入门不踩坑!从概念到搭环境,后端 er 看完就能用
大数据·后端·kafka
在未来等你19 小时前
Elasticsearch面试精讲 Day 18:内存管理与JVM调优
大数据·分布式·elasticsearch·搜索引擎·面试
智海观潮20 小时前
Spark SQL | 目前Spark社区最活跃的组件之一
大数据·spark
Lx35220 小时前
Hadoop数据一致性保障:处理分布式系统常见问题
大数据·hadoop
Elasticsearch20 小时前
在 Elastic Observability 中使用 Discover 的追踪获取更深入的应用洞察
elasticsearch
婲落ヽ紅顏誶20 小时前
测试es向量检索
大数据·elasticsearch·搜索引擎