Elasticsearch 索引副本数

作者:来自 Elastic Kofi Bartlett

解释如何配置 number_of_replicas、它的影响以及最佳实践。

更多阅读:Elasticsearch 中的一些重要概念: cluster, node, index, document, shards 及 replica

想获得 Elastic 认证?查看下一期 Elasticsearch 工程师培训什么时候开始!

Elasticsearch 拥有大量新功能,能帮助你为你的使用场景构建最佳搜索解决方案。深入了解我们的示例笔记本,开始免费云试用,或立即在本地机器上尝试 Elastic。


Elasticsearch 被设计为一个分布式系统,能够处理大量数据并提供高可用性。其中一个关键特性是索引副本的概念,它由 number_of_replicas 设置控制。本文将深入探讨这个设置的细节、其影响以及如何正确配置它。

副本在 Elasticsearch 中的作用

在 Elasticsearch 中,索引是一组文档的集合,这些文档被划分到多个主分片中。每个主分片是一个独立的 Apache Lucene 索引,索引中的文档被分布在所有主分片之间。为了确保高可用性和数据冗余,Elasticsearch 允许每个分片有一个或多个副本,称为副本分片。

number_of_replicas 设置控制 Elasticsearch 为索引中的每个主分片创建多少个副本分片(副本)。默认情况下,Elasticsearch 为每个主分片创建一个副本,但可以根据系统的需求进行更改。

配置 number_of_replicas

number_of_replicas 设置可以在创建索引时配置,也可以在之后更新。以下是在创建索引时设置的方法:

复制代码
PUT /my_index
{
  "settings": {
    "number_of_replicas": 2
  }
}

在这个例子中,Elasticsearch 会为 my_index 索引中的每个主分片创建两个副本。

要更新已存在索引的 number_of_replicas 设置,可以使用 _settings API:

这个命令会将 my_index 索引更新为每个主分片有三个副本。

number_of_replicas 设置的影响

number_of_replicas 设置对 Elasticsearch 集群的性能和弹性有重大影响。以下是一些关键点需要考虑:

  1. 数据冗余和可用性 :增加 number_of_replicas 通过为每个分片创建更多副本来提高数据的可用性。如果某个节点发生故障,Elasticsearch 仍然可以从剩余节点上的副本分片提供数据。
  2. 搜索性能:副本分片可以处理读取请求,因此拥有更多副本可以通过在更多分片之间分配负载来提升搜索性能。
  3. 写入性能 :但每次写入操作都必须在每个分片副本上执行。因此,较高的 number_of_replicas 会因为需要执行更多写操作而降低索引性能。
  4. 存储需求:更多副本意味着更多的存储空间。你需要确保集群有足够的容量来存储额外的副本。
  5. 对节点故障的抗性number_of_replicas 应该根据集群中的节点数量来设置。如果副本数量大于等于节点数量,集群可以在多个节点故障的情况下仍然不丢失数据。

设置 number_of_replicas 的最佳实践

最优的 number_of_replicas 设置取决于你系统的具体需求。但以下是一些通用的最佳实践:

  • 对于单节点集群,number_of_replicas 应设置为 0,因为没有其他节点来存储副本。

  • 对于多节点集群,number_of_replicas 应至少设置为 1,以确保数据冗余和高可用性。

  • 如果搜索性能是优先考虑的目标,可以考虑增加 number_of_replicas。但要注意与写入性能和存储需求之间的权衡。

  • 始终确保你的集群有足够的容量来存储额外的副本。

更多阅读:

原文:Elasticsearch Index Number_of_Replicas - Elasticsearch Labs

相关推荐
倔强的石头_5 小时前
KingbaseES 新版MySQL 兼容版体验:旧版迁移 + 功能实测
数据库
大大大大晴天19 小时前
Hudi技术内幕:Key Generation原理与实践
大数据
Elasticsearch1 天前
3个信号、2个环境变量、0个采集器:使用 Python 和 Elastic 的托管 OTLP 端点实现 OpenTelemetry
elasticsearch
Elasticsearch3 天前
如何通过 Claude Code 来写入 CSV 数据到 Elasticsearch
elasticsearch
倔强的石头_3 天前
《Kingbase护城河》——数据库存储空间全景探测与精细化瘦身实战
数据库
冬奇Lab4 天前
每日一个开源项目(第134篇):Zvec - 阿里开源的嵌入式向量数据库,向量搜索界的 SQLite
数据库·人工智能·llm
ClouGence4 天前
Oracle CDC 架构优化:从主库直连到 DataGuard 备库同步
数据库·后端·oracle
得物技术4 天前
从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
大数据·llm·ai编程
久美子4 天前
AI驱动数仓建设的Harness工程实践——本体建模、知识分层与上下文工程
大数据