elasticsearch的学习（四）：elasticsearch的一些基本概念

elasticsearch的一些基本概念。

索引：一个拥有相似特征的文档的集合。

类型：在索引中定义，是索引的一个逻辑上的分类，版本7以上已经弃用了。

文档：可被索引的基础信息单元，即一条数据，是json格式的。

字段：对文档数据根据不同的属性进行分类的标识

映射：处理数据的方式，规则方面的限制。比如字段的类型，默认值，是否被索引等。

分片：将索引划分为多份，每一份就是一个分片。在创建索引的时候可以指定分片的数量，每个分片也是一个功能完善且独立的索引，可以被放置到集群中的任何节点上。

好处：可以水平分割数据，扩展内容的容量；可以在分片上进行分布式的，并行的操作，提高es的性能和吞吐量。

副本：分片的拷贝，作为备份。

好处：高可用性，副本和源分片不在同一个节点上；可以在副本上进行搜索，提高了es的吞吐量

分配：由master来进行将分片，副本分配到某个节点，分片和副本之间的复制也由master负责。

在创建索引的时候，使用postman发送put请求：http://localhost:9201/student

创建student索引，在postman的body中添加

bash 复制代码

{
    "settings":{
        "number_of_shards":3,
        "number_of_replicas":1
    }
}

表示创建3个分片，一个副本。

在增加节点的时候，会自动的分配分片和副本到新的节点上

在运行的集群上是可以动态的调整副本数的（分片数是不能改的），可以按需伸缩集群。

body中：

bash 复制代码

{
        "number_of_replicas":2
}

在集群中插入一条数据的时候，是插入主分片的，至于是插入到哪个节点，或者说哪个分片，是通过路由计算决定的。

路由计算：数据的id%分片数

在集群中查询一条数据的时候，可以访问任何一个节点来获取数据，访问的这个节点就是协调节点，它会使用内部的哈希算法来确定目标数据所在的分片，然后转发到这个分片上。

在elasticsearch集群中，写入一条数据的流程：

在elasticsearch集群中，查询一条数据的流程：

分片是elasticsearch最小的工作单元