Elasticsearch(ES)分片(Shard)和 副本分片(Replica Shard)

作者介绍:简历上没有一个精通的运维工程师。请点击上方的蓝色《运维小路》关注我,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。

中间件,我给它的定义就是为了实现某系业务功能依赖的软件,包括如下部分:

Web服务器

代理服务器

ZooKeeper

Kafka

RabbitMQ

Hadoop HDFS

Elasticsearch ES (本章节)

前面我们介绍了ES里面的核心概念索引和文档,我们下面来通过命令查询和创建它,并且就顺势就引入了主分片和副本分片的概念。

分片

创建索引(Index)

创建索引的时候也可以不指定索引的分片和副本数量,默认他们都是1(不同的版本这个数字则不一样)。

vbnet 复制代码
curl -X PUT "http://192.168.31.171:9200/my_index" -H "Content-Type: application/json" -d'
{
  "settings": {
    "number_of_shards": 3,
    "number_of_replicas": 2
  }
}'

#返回下面就是提示成功了
{"acknowledged":true,"shards_acknowledged":true,"index":"my_index"}

number_of_shards:就是分片数量,这里定义了3个分片。``number_of_replicas:就是副本,这里定义了2个副本,总共加起来就是3份数据。

arduino 复制代码
[root@localhost ~]# curl -X GET "http://192.168.31.171:9200/_cat/indices?v"
health status index            uuid                   pri rep docs.count docs.deleted store.size pri.store.size
green  open   .geoip_databases _-JYNHNfToypQ7CADx8YhQ   1   1         40            0     76.8mb         38.4mb
green  open   my_index         k_ThO4UlTFOCbmmOiYMEig   3   2          0            0      1.9kb           681b

health:索引的健康状态(green,yellow,red)。只要有一个索引非green,集群就是非green状态。

status:索引的状态(open,close),这个只有在为了减少jvm内存占用的情况下会设置关闭。

index:索引的名字,es默认自带的一个索引+我们创建2的索引。

uuid:索引id

pr:主分片数量,也就是我们前面创建的适合定义的number_of_shards。创建时候固定,不能修改。

rep:副本分片数量,number_of_replicas创建的时候定义,可以后期修改。

docs.count:文档的数量,通过这个我们就知道索引里面有多少数据。

docs.deleted:待删除的文档数量。

store.size:索引占用的实际磁盘空间(包含副本数据)。

pri.store.size:原始数据大小(不包含副本数据)

分片副本

less 复制代码
[root@localhost ~]# curl -X GET "http://192.168.31.171:9200/_cat/shards?v"
index                                                         shard prirep state   docs  store ip             node
.ds-ilm-history-5-2025.08.01-000001                           0     r      STARTED             192.168.31.173 node-173
.ds-ilm-history-5-2025.08.01-000001                           0     p      STARTED             192.168.31.172 node-172
.ds-.logs-deprecation.elasticsearch-default-2025.08.01-000001 0     r      STARTED             192.168.31.171 node-171
.ds-.logs-deprecation.elasticsearch-default-2025.08.01-000001 0     p      STARTED             192.168.31.173 node-173
my_index                                                      2     r      STARTED    0   227b 192.168.31.171 node-171
my_index                                                      2     r      STARTED    0   227b 192.168.31.173 node-173
my_index                                                      2     p      STARTED    0   227b 192.168.31.172 node-172
my_index                                                      1     r      STARTED    0   227b 192.168.31.171 node-171
my_index                                                      1     p      STARTED    0   227b 192.168.31.173 node-173
my_index                                                      1     r      STARTED    0   227b 192.168.31.172 node-172
my_index                                                      0     p      STARTED    0   227b 192.168.31.171 node-171
my_index                                                      0     r      STARTED    0   227b 192.168.31.173 node-173
my_index                                                      0     r      STARTED    0   227b 192.168.31.172 node-172
.geoip_databases                                              0     r      STARTED   40 38.4mb 192.168.31.171 node-171
.geoip_databases                                              0     p      STARTED   40 38.4mb 192.168.31.172 node-172
[root@localhost ~]# 

index:索引名字,以"."开头都是系统索引,我们暂时不用关注。

shard:分片编号,默认以0开头,可以看到我们前面创建的0,1,2编号的分片及他的副本分片。

prirep:分片属性,主分片及副本分片。

state:分片状态,一般正常看到的都是STARTED状态。我们查询集群状态就有一个操作是检查UNASSIGNED状态数量。

docs:分片是文档数量,一般而言每个分片都是几乎相等的。

store:分片大小。

ip:分片所在节点ip。

node:分片所在节点名字(存在一个服务器多个节点的情况)。

运维小路

一个不会开发的运维!一个要学开发的运维!一个学不会开发的运维!欢迎大家骚扰的运维!

关注微信公众号《运维小路》获取更多内容。

相关推荐
肉清17 小时前
linux自用命令
linux·服务器·前端
星星泡饭29217 小时前
工业标识自动化——MARKING Configurator 从数据导入到热转移打印的全流程教程
运维·自动化·菲尼克斯
Xの哲學17 小时前
Linux链路聚合深度解析: 从概念到内核实现
linux·服务器·算法·架构·边缘计算
中科米堆17 小时前
自动化大尺寸批量3D检测,自动化三维扫描系统实现钢板支架在线检测-中科米堆CASAIM
运维·3d·自动化·3d全尺寸检测
Dxy123931021617 小时前
Elasticsearch 聚合入门:像 Excel 透视表一样分析数据
elasticsearch·excel
cetcht888817 小时前
35kV-750kV 变电站集中监控系统(涵盖火灾消防、安全防卫、动环、智能锁控、智能巡视等) 设备配置与布置
大数据·运维·物联网·机器人·能源
wanhengidc17 小时前
具有ARM架构云手机的功能
运维·服务器·arm开发·科技·智能手机·云计算
图乐aj17 小时前
MySQL 运维之日常运维篇 二
运维·mysql
Elastic 中国社区官方博客17 小时前
通过 Elasticsearch 中的 function score query 按利润和受欢迎程度提升电商搜索效果
大数据·数据库·elasticsearch·搜索引擎·全文检索
wanhengidc17 小时前
巨 椰 云手机离线多开
运维·服务器·科技·智能手机·云计算