SpringCloud 微服务全栈体系(十三)

第十一章 分布式搜索引擎 elasticsearch

二、索引库操作

  • 索引库就类似数据库表,mapping 映射就类似表的结构。

  • 我们要向 es 中存储数据,必须先创建"库"和"表"。

1. mapping 映射属性

  • mapping 是对索引库中文档的约束,常见的 mapping 属性包括:

    • type:字段数据类型,常见的简单类型有:
      • 字符串:text(可分词的文本)、keyword(精确值,例如:品牌、国家、ip 地址)
      • 数值:long、integer、short、byte、double、float
      • 布尔:boolean
      • 日期:date
      • 对象:object
    • index:是否创建索引,默认为 true
    • analyzer:使用哪种分词器
    • properties:该字段的子字段
  • 例如下面的 json 文档:

json 复制代码
{
    "age": 21,
    "weight": 52.1,
    "isMarried": false,
    "info": "小帽课堂学习Java",
    "email": "alex@gmail.com",
    "score": [99.1, 99.5, 98.9],
    "name": {
        "firstName": "云",
        "lastName": "赵"
    }
}
  • 对应的每个字段映射(mapping):

    • age:类型为 integer;参与搜索,因此需要 index 为 true;无需分词器
    • weight:类型为 float;参与搜索,因此需要 index 为 true;无需分词器
    • isMarried:类型为 boolean;参与搜索,因此需要 index 为 true;无需分词器
    • info:类型为字符串,需要分词,因此是 text;参与搜索,因此需要 index 为 true;分词器可以用 ik_smart
    • email:类型为字符串,但是不需要分词,因此是 keyword;不参与搜索,因此需要 index 为 false;无需分词器
    • score:虽然是数组,但是我们只看元素的类型,类型为 float;参与搜索,因此需要 index 为 true;无需分词器
    • name:类型为 object,需要定义多个子属性
      • name.firstName;类型为字符串,但是不需要分词,因此是 keyword;参与搜索,因此需要 index 为 true;无需分词器
      • name.lastName;类型为字符串,但是不需要分词,因此是 keyword;参与搜索,因此需要 index 为 true;无需分词器

2. 索引库的 CRUD

  • 这里统一使用 Kibana 编写 DSL 的方式来演示。
2.1 创建索引库和映射
2.1.1 基本语法
  • 请求方式:PUT
  • 请求路径:/索引库名,可以自定义
  • 请求参数:mapping 映射
2.1.2 格式
json 复制代码
PUT /索引库名称
{
  "mappings": {
    "properties": {
      "字段名":{
        "type": "text",
        "analyzer": "ik_smart"
      },
      "字段名2":{
        "type": "keyword",
        "index": "false"
      },
      "字段名3":{
        "properties": {
          "子字段": {
            "type": "keyword"
          }
        }
      },
      // ...略
    }
  }
}
2.1.3 示例
sh 复制代码
PUT /alex
{
  "mappings": {
    "properties": {
      "info":{
        "type": "text",
        "analyzer": "ik_smart"
      },
      "email":{
        "type": "keyword",
        "index": "false"
      },
      "name":{
        "properties": {
          "firstName": {
            "type": "keyword"
          }
        }
      },
      // ... 略
    }
  }
}
2.2 查询索引库
2.2.1 基本语法
  • 请求方式:GET

  • 请求路径:/索引库名

  • 请求参数:无

2.2.2 格式
json 复制代码
GET /索引库名
2.2.3 示例
2.3 修改索引库
  • 倒排索引结构虽然不复杂,但是一旦数据结构改变(比如改变了分词器),就需要重新创建倒排索引,这简直是灾难。因此索引库一旦创建,无法修改 mapping

  • 虽然无法修改 mapping 中已有的字段,但是却允许添加新的字段到 mapping 中,因为不会对倒排索引产生影响。

2.3.1 语法说明
json 复制代码
PUT /索引库名/_mapping
{
  "properties": {
    "新字段名":{
      "type": "integer"
    }
  }
}
2.3.2 示例
2.4 删除索引库
2.4.1 语法
  • 请求方式:DELETE

  • 请求路径:/索引库名

  • 请求参数:无

2.4.2 格式
复制代码
DELETE /索引库名
  • 在 kibana 中测试:
2.5 总结
  • 索引库操作有哪些?

    • 创建索引库:PUT /索引库名
    • 查询索引库:GET /索引库名
    • 删除索引库:DELETE /索引库名
    • 添加字段:PUT /索引库名/_mapping

三、文档操作

1. 新增文档

1.1 语法
json 复制代码
POST /索引库名/_doc/文档id
{
    "字段1": "值1",
    "字段2": "值2",
    "字段3": {
        "子属性1": "值3",
        "子属性2": "值4"
    },
    // ...
}
1.2 示例
json 复制代码
POST /alex/_doc/1
{
    "info": "小帽课堂学习Java",
    "email": "alex@gmail.com",
    "name": {
        "firstName": "云",
        "lastName": "赵"
    }
}
1.3 响应

2. 查询文档

  • 根据 rest 风格,新增是 post,查询应该是 get,不过查询一般都需要条件,这里我们把文档 id 带上。
2.1 语法
json 复制代码
GET /{索引库名称}/_doc/{id}
2.2 通过 kibana 查看数据
js 复制代码
GET /alex/_doc/1
2.3 查看结果

3. 删除文档

  • 删除使用 DELETE 请求,同样,需要根据 id 进行删除:
3.1 语法
js 复制代码
DELETE /{索引库名}/_doc/id值
3.2 示例
json 复制代码
# 根据id删除数据
DELETE /alex/_doc/1

4. 修改文档

  • 修改有两种方式:

    • 全量修改:直接覆盖原来的文档
    • 增量修改:修改文档中的部分字段
4.1 全量修改
  • 全量修改是覆盖原来的文档,其本质是:

    • 根据指定的 id 删除文档
    • 新增一个相同 id 的文档
  • 注意:如果根据 id 删除时,id 不存在,第二步的新增也会执行,也就从修改变成了新增操作了。

4.1.1 语法
json 复制代码
PUT /{索引库名}/_doc/文档id
{
    "字段1": "值1",
    "字段2": "值2",
    // ... 略
}
4.1.2 示例
json 复制代码
PUT /alex/_doc/1
{
    "info": "小帽课堂学习高级Java",
    "email": "alex@gmail.com",
    "name": {
        "firstName": "云",
        "lastName": "赵"
    }
}
4.2 增量修改
  • 增量修改是只修改指定 id 匹配的文档中的部分字段。
4.2.1 语法
json 复制代码
POST /{索引库名}/_update/文档id
{
    "doc": {
         "字段名": "新的值",
    }
}
4.2.2 示例
json 复制代码
POST /alex/_update/1
{
  "doc": {
    "email": "ZhaoYun@gmail.com"
  }
}

5. 总结

  • 文档操作有哪些?

    • 创建文档:POST /{索引库名}/_doc/文档 id { json 文档 }
    • 查询文档:GET /{索引库名}/_doc/文档 id
    • 删除文档:DELETE /{索引库名}/_doc/文档 id
    • 修改文档:
      • 全量修改:PUT /{索引库名}/_doc/文档 id { json 文档 }
      • 增量修改:POST /{索引库名}/_update/文档 id { "doc": {字段}}
相关推荐
朝新_4 小时前
【Spring AI 】核心知识体系梳理:从入门到实战
java·人工智能·spring
谁怕平生太急5 小时前
面试题记录:在线数据迁移
java·数据库·spring
云烟成雨TD7 小时前
Spring AI Alibaba 1.x 系列【18】Hook 接口和四大抽象类
java·人工智能·spring
StackNoOverflow7 小时前
Spring Cloud的注册中心和配置中心(Nacos)
后端·spring cloud
Flittly9 小时前
【SpringSecurity新手村系列】(2)整合 MyBatis 实现数据库认证
java·安全·spring·springboot·安全架构
devilnumber10 小时前
java中Redisson ,jedis,Lettuce和Spring Data Redis的四种深度对比和优缺点详解
java·redis·spring
砍材农夫10 小时前
spring-ai 第十一mcp server调用入门(stdio协议)
人工智能·spring·microsoft
码农阿豪10 小时前
一次 AI 调用 15 万 Token 只花了 $0.058?彻底搞懂 Token、缓存读、补全计费机制!(附完整架构图)
人工智能·spring·缓存
awljwlj10 小时前
黑马点评复习—缓存相关【包含可能的问题和基础知识复习】
java·后端·spring·缓存
庞轩px11 小时前
反射与动态代理——Java语言动态性的核心
java·spring·反射·aop·动态代理·类型