elasticsearch的学习(四):elasticsearch的一些基本概念

简介

elasticsearch的一些基本概念。

核心概念

索引:一个拥有相似特征的文档的集合。

类型:在索引中定义,是索引的一个逻辑上的分类,版本7以上已经弃用了。

文档:可被索引的基础信息单元,即一条数据,是json格式的。

字段:对文档数据根据不同的属性进行分类的标识

映射:处理数据的方式,规则方面的限制。比如字段的类型,默认值,是否被索引等。

分片:将索引划分为多份,每一份就是一个分片。在创建索引的时候可以指定分片的数量,每个分片也是一个功能完善且独立的索引,可以被放置到集群中的任何节点上。

好处:可以水平分割数据,扩展内容的容量;可以在分片上进行分布式的,并行的操作,提高es的性能和吞吐量。

副本:分片的拷贝,作为备份。

好处:高可用性,副本和源分片不在同一个节点上;可以在副本上进行搜索,提高了es的吞吐量

分配:由master来进行将分片,副本分配到某个节点,分片和副本之间的复制也由master负责。

创建分片

在创建索引的时候,使用postman发送put请求:http://localhost:9201/student

创建student索引,在postman的body中添加

bash 复制代码
{
    "settings":{
        "number_of_shards":3,
        "number_of_replicas":1
    }
}

表示创建3个分片,一个副本。

在增加节点的时候,会自动的分配分片和副本到新的节点上

修改分片数

在运行的集群上是可以动态的调整副本数的(分片数是不能改的),可以按需伸缩集群。

postman发送put请求:http://localhost:9201/student/_settings

body中:

bash 复制代码
{
        "number_of_replicas":2
}

查看集群信息

使用postman发送get请求:http://localhost:9201/_cat/shards/索引名?v=true\&h=index,shard,prirep,state,docs,store

路由计算

在集群中插入一条数据的时候,是插入主分片的,至于是插入到哪个节点,或者说哪个分片,是通过路由计算决定的。

路由计算:数据的id%分片数

分片控制

在集群中查询一条数据的时候,可以访问任何一个节点来获取数据,访问的这个节点就是协调节点,它会使用内部的哈希算法来确定目标数据所在的分片,然后转发到这个分片上。

写数据流程

在elasticsearch集群中,写入一条数据的流程:

  1. 客户端请求集群节点(任意一个)
  2. 这个被访问的节点就是协调节点
  3. 协调节点将请求转发到指定的节点(通过路由计算)
  4. 主分片将数据保存
  5. 主分片将数据发送给副本
  6. 主分片进行反馈
  7. 客户端获得反馈

读数据流程

在elasticsearch集群中,查询一条数据的流程:

  1. 客户端发送查询请求到协调节点
  2. 协调节点计算数据所在的分片以及全部的副本位置(查询全部是为了轮询 )
  3. 将请求转发给具体的节点
  4. 节点返回查询结果,将结果返回给客户端

分片是elasticsearch最小的工作单元

相关推荐
跨境卫士小树36 分钟前
店铺矩阵崩塌前夜:跨境多账号运营的3个生死线
大数据·线性代数·矩阵
贩卖纯净水.1 小时前
REACT学习DAY02(恨连接不上服务器)
服务器·学习·react.js
roman_日积跬步-终至千里1 小时前
【Flink 实战】Flink 中 Akka 通信与内存占用分析
大数据·flink
南风过闲庭2 小时前
操作系统研究
大数据·人工智能·科技·学习·ai·系统架构
阿里云大数据AI技术2 小时前
美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台
大数据·阿里云·spark·serverless·emr
亿信华辰软件2 小时前
政策解读:制造企业如何实施数字化转型
大数据·数据分析·制造
资讯新鲜事2 小时前
重构建筑未来:中建海龙MiC建筑技术开启智慧建造新篇章
大数据·人工智能
Tianyanxiao3 小时前
【探商宝】2025年2月科技与商业热点头条:AI竞赛、量子计算与芯片市场新格局
大数据·人工智能·经验分享·数据分析
码上淘金3 小时前
Apache Flink架构深度解析:任务调度、算子数据同步与TaskSlot资源管理机制
大数据·架构·flink
fruge4 小时前
git上传 项目 把node_modules也上传至仓库了,在文件.gitignore 中忽略node_modules 依然不行
大数据·git·elasticsearch