ElasticSearch|ES|架构介绍|原理浅析

架构介绍

节点 (Nodes) :

Elasticsearch 集群由多个节点组成,每个节点是一个独立运行的 Elasticsearch 实例。节点之间通过内部通信协议相互协作。

  1. Master Node:

    • 主节点负责管理集群范围的操作,例如创建或删除索引、分配和重新分配分片、维护集群状态等。主节点并不直接参与数据存储和查询。
  2. Data Node:

    • 数据节点负责存储索引数据并执行相关的 CRUD 操作(创建、读取、更新、删除)。它们持有索引的分片,并执行实际的搜索和聚合操作。
  3. Client Node:

    • 客户端节点专门处理请求的路由、搜索和聚合计算,但不存储数据。通常客户端角色会和其他角色如数据节点合并在一起。

索引和分片 (Indices and Shards) :

Elasticsearch 中的数据按照索引组织,每个索引又被划分为多个分片(默认情况下是主分片和副本分片)。这种水平分割策略使得数据可以分布在整个集群上,实现水平扩展和高可用性。

集群发现与协调 (Cluster Discovery & Coordination) :

Elasticsearch 使用 Zen Discovery 进行节点间的自动发现和集群健康检查。此外,通过使用不同的选举算法确定主节点,确保集群始终有一个活跃的主节点来管理和维护集群状态。

一致性层 (Consistency Layer) :

借助版本控制和乐观并发控制机制,Elasticsearch 在分布式环境中提供了一致性的保证。当对文档进行修改时,系统会跟踪文档的版本号,防止并发冲突。

数据持久化与恢复 :

Elasticsearch 数据首先写入 Lucene 的倒排索引文件,然后同步至磁盘,并配合 Translog 日志(transaction log)确保在宕机时能恢复未完全提交的数据。

原理解析

Lucene 基础 :

Elasticsearch 构建在 Apache Lucene 之上,Lucene 是一个强大的文本搜索库,提供了高效的索引和搜索功能。Elasticsearch 对 Lucene 进行了封装和扩展,使其成为一个分布式系统。

分布式搜索与索引 :

Elasticsearch 将索引拆分成多个分片,分散存储在不同节点上。查询时,请求会被路由到拥有相关数据分片的节点上进行本地搜索,然后将结果汇聚返回给客户端。

实时性 :

Elasticsearch 支持近乎实时(Near Real-Time, NRT)的索引更新和搜索,通过异步方式将内存中的索引变更刷新到磁盘,并且在每次刷新后立即使之可用于搜索。

横向扩展 :

随着数据量的增长和负载需求的变化,可以通过添加更多的节点来扩展集群容量。Elasticsearch 自动管理和均衡分片在各个节点之间的分布,确保整个系统的负载均衡。

故障转移与高可用 :

每个索引分片都有相应的副本分片,分布在不同的节点上。当主分片不可用时,副本分片可以自动提升为主分片,从而维持集群的高可用性和数据完整性。

相关推荐
文火冰糖的硅基工坊2 小时前
[嵌入式系统-100]:常见的IoT(物联网)开发板
人工智能·物联网·架构
Hy行者勇哥2 小时前
公司全场景运营中 PPT 的类型、功能与作用详解
大数据·人工智能
liliangcsdn3 小时前
如何基于ElasticsearchRetriever构建RAG系统
大数据·elasticsearch·langchain
乐迪信息3 小时前
乐迪信息:基于AI算法的煤矿作业人员安全规范智能监测与预警系统
大数据·人工智能·算法·安全·视觉检测·推荐算法
极验3 小时前
iPhone17实体卡槽消失?eSIM 普及下的安全挑战与应对
大数据·运维·安全
失散134 小时前
分布式专题——39 RocketMQ客户端编程模型
java·分布式·架构·rocketmq
相与还4 小时前
IDEA和GIT实现cherry pick拣选部分变更到新分支
git·elasticsearch·intellij-idea
B站_计算机毕业设计之家4 小时前
推荐系统实战:python新能源汽车智能推荐(两种协同过滤+Django 全栈项目 源码)计算机专业✅
大数据·python·django·汽车·推荐系统·新能源·新能源汽车
许泽宇的技术分享4 小时前
当Excel遇上大语言模型:ExcelAgentTemplate架构深度剖析与实战指南
语言模型·架构·excel
杂化轨道VSEPR4 小时前
多制式基站综合测试线的架构与验证实践(3)
架构