Elasticsearch 节点角色详解及协调节点请求策略

引言

Elasticsearch 集群中的节点可以承担多种角色,如主节点、数据节点、预处理节点和协调节点。合理配置和理解这些节点角色,对于保障集群的高可用性、性能优化以及请求调度至关重要。本文将深入解析各类节点的职责与配置方式,并介绍如何通过客户端实现请求只发送到协调节点的实践方法,帮助您更好地设计与运维 Elasticsearch 集群架构。

节点种类

一个节点可以同时扮演多个角色,包括 Master Node、Data Node、Coordinating Node 和 Ingest Node。事实上,默认情况下,Elasticsearch 中的所有节点通常都是多角色节点(三个配置默认值都为true),即它们可以同时充当 Master Node、Data Node、Coordinating Node 和 Ingest Node 的角色。这种多角色的配置可以在小规模集群中简化架构,并且在资源有限的情况下有效利用每个节点的能力。

一个节点同时是Master Node、Data Node、Ingest Node。

复制代码
node.master: true
node.data: true
node.ingest: true

主节点(Master Node)

负责管理集群的状态,包括节点的加入和离开、索引的创建和删除、分片的分配和重分配等。建议配置至少三个 Master Node 作为候选主节点以确保高可用性,一个 ES 集群只能有一个主节点。

复制代码
node.master: true
node.data: false
node.ingest: false

数据节点(Data Node)

存储实际的数据,并处理所有数据相关的操作,如文档的创建、更新、删除,以及搜索和聚合请求。

复制代码
node.master: false
node.data: true
node.ingest: false

预处理节点(Ingest Node)

通过预处理管道(Ingest Pipeline)在文档被索引之前对其进行各种处理,例如添加字段、删除字段、修改字段值等。当使用Ingest Pipelines时,Elasticsearch会将文档发送到Ingest Node。

复制代码
node.master: false
node.data: false
node.ingest: true

协调节点(Coordinating Node)

接收来自客户端的请求,并将这些请求进行请求接收与分发、查询合并以及负载均衡等功能。

复制代码
node.master: false
node.data: false
node.ingest: false

如何能让请求只发送到协调节点?

如果想请求只发送到协调节点,可以通过RestHighLevelClient创建客户端时指定节点,客户端会轮询这些节点进行请求来实现。

复制代码
// 创建RestHighLevelClient实例,连接到Elasticsearch集群中的多个节点
RestHighLevelClient client = new RestHighLevelClient(
    RestClient.builder(
        new HttpHost("node1.example.com", 9200, "http"), // 集群中的第一个节点
        new HttpHost("node2.example.com", 9200, "http"), // 集群中的第二个节点
        new HttpHost("node3.example.com", 9200, "http")  // 集群中的第三个节点
    )
);

注:官方说,协调节点最好不要单独分离出来,跟数据节点在一起就行。分离开的意义不大。


感谢您的阅读!如果文章中有任何问题或不足之处,欢迎及时指出,您的反馈将帮助我不断改进与完善。期待与您共同探讨技术,共同进步!

相关推荐
武子康2 小时前
大数据-241 离线数仓 - 实战:电商核心交易数据模型与 MySQL 源表设计(订单/商品/品类/店铺/支付)
大数据·后端·mysql
IvanCodes2 小时前
一、消息队列理论基础与Kafka架构价值解析
大数据·后端·kafka
武子康1 天前
大数据-240 离线数仓 - 广告业务 Hive ADS 实战:DataX 将 HDFS 分区表导出到 MySQL
大数据·后端·apache hive
洛森唛2 天前
ElasticSearch查询语句Query String详解:从入门到精通
后端·elasticsearch
字节跳动数据平台2 天前
5000 字技术向拆解 | 火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
武子康2 天前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive
洛森唛3 天前
Elasticsearch DSL 查询语法大全:从入门到精通
后端·elasticsearch
字节跳动数据平台3 天前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术3 天前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
武子康3 天前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive