Elasticsearch 基础之映射(mappping)

1、简介

在上文中我们介绍了Elasticsearch对于索引和文档的基本操作,虽然掌握了如何对于索引中的文档增删改查操作,但是对于文档中的字段类型如何定义,以及字段索引是如何进行分词操作都不甚了解,本文介绍Elasticsearch中的映射概念,将Elasticsearch中的字段类型一一讲解清楚。

上文中介绍了mapping的基本概念,对于Mysql数据库而言,Elasticsearch中的Mapping相当于数据库的表结构,也就是各个字段定义,包括字段名称、类型,分词、是否创建索引等属性。

2、Elasticsearch 常用数据类型
2.1、自动映射数据类型

当我们创建完索引,向索引中写入新数据,Elasticsearch 会根据字段的值来推断字段类型,进而自动创建并指定对应字段类型。主要有以下规则:

|-------------|----------------|
| 写入的字段类型 | 推断字段类型 |
| true/false | boolean |
| 小数 | float |
| 数字 | long |
| 日期字符串 | date |
| 数字类型的字符串 | float/long |
| object | object |
| 数组([...]) | 取决于数组第一个元素类型 |
| 其他字符串 | text + keyword |

注: 在使用动态映射的时候,Elasticsearch会使用更宽类型去匹配,为了避免空间浪费,尽可能使用手动映射,不使用自动映射。

2.2、手动映射数据类型

手动映射是指在创建索引时指定索引中每个字段类型、分词器等参数(类似于建表语句中指定字段名、字段类型等)。下面是一些常用的数据类型,随着学习深入将介绍更短复杂的数据类型。

|-----------|--------------------------|
| 字段类型 | 说明 |
| long | 八个字节有符号整数 |
| integer | 四个字节有符号整数 |
| float | 四字节单精度浮点数 |
| double | 八字节双精度浮点数 |
| short | 两个字节(有符号整型:-32768-32767) |
| byte | 一个字节(有符号整型:-128-127) |
| boolean | 布尔类型 |
| text | 文本数据类型,用于全文检索 |
| date | 日期 |
| keyword | 精确匹配类型:一般用于精确匹配和聚合字段 |
| object | 值为 json 对象(object 类型) |
| nested | 嵌套类型 |
| geo_point | 地理位置(经度,纬度) |
| geo_point | 多边形 |

3、手动定义Mapping
3.1、自定义映射

常用定义映射操作如下:

bash 复制代码
PUT /<index_name>
{
  "mappings": {
    "properties": {
      "field_a": {
        "<parameter_name>": "<parameter_value>",
        "index": false,  # 是否创建索引(是否支持被检索),默认为true
        "analyzer":"ik_smart",  # 指定分词器,只有text类型的支持
        "coerce": false,  # 是否允许强制类型转换, 例如:"1" => 1,只在数字类型支持
        "copy_to": "all",  # 将该字段拷贝到all中,可以多个字段都拷贝到all,可以实现聚合查询
        "format":"yyyy-MM-dd"  # 常用于日期格式化
      }, 
      "name":{                
          "properties":{
             "firstName":{
                "type":"keyword",
                "ignore_above": 512  # 长度超过会被忽略,数据会保存,但查询不到
             }
          }
       },
        "all":{                
          "type":"text",
          "analyzer":"ik_smart"
       }
      ...
    }
  }
}
3.2、查看创建的映射
bash 复制代码
# 1、查看完整的索引 mapping
GET /<index_name>/_mappings
# 2、查看索引中指定字段的 mapping
GET /<index_name>/_mappings/field/<field_name>
3.3、修改映射属性

注:并非所有映射属性都可以修改,字段类型不可修改,分词器不可修改,是否支持倒排索引不可修改等。

bash 复制代码
PUT <index_name>/_mapping
{
  "properties": {
    "<field_name>": {
      "type": "text",	// 必须和原字段类型相同,而且必须显式声明
      "analyzer":"ik_master"	// 必须和原分词器类型相同,而且必须显式声明
    }
  }
}
4、总结

本文简要介绍Elasticsearch中的mapping的基本概念和使用,后续将更加细致说明如何更加高效创建mapping和更加高效使用Elasticsearch。

相关推荐
李昊哲小课3 分钟前
deepin 安装 kafka
大数据·分布式·zookeeper·数据分析·kafka
FIN666842 分钟前
张剑教授:乳腺癌小红书(2025年版)更新,芦康沙妥珠单抗成功进入TNBC二线推荐,彰显乳腺癌诊疗的“中国力量”
大数据·搜索引擎·健康医疗
core5125 小时前
flink sink doris
大数据·mysql·flink·doris·存储·sink·过程正常
武子康8 小时前
大数据-258 离线数仓 - Griffin架构 配置安装 Livy 架构设计 解压配置 Hadoop Hive
java·大数据·数据仓库·hive·hadoop·架构
lucky_syq9 小时前
Flume和Kafka的区别?
大数据·kafka·flume
AI_NEW_COME10 小时前
构建全方位大健康零售帮助中心:提升服务与体验
大数据·人工智能
it噩梦10 小时前
es 中 terms set 使用
大数据·elasticsearch
中科岩创10 小时前
中科岩创边坡自动化监测解决方案
大数据·网络·物联网
DolphinScheduler社区11 小时前
作业帮基于 Apache DolphinScheduler 3_0_0 的缺陷修复与优化
大数据
SeaTunnel11 小时前
京东科技基于 Apache SeaTunnel 复杂场景适配 #数据集成
大数据