Elasticsearch 基础之映射(mappping)

1、简介

在上文中我们介绍了Elasticsearch对于索引和文档的基本操作,虽然掌握了如何对于索引中的文档增删改查操作,但是对于文档中的字段类型如何定义,以及字段索引是如何进行分词操作都不甚了解,本文介绍Elasticsearch中的映射概念,将Elasticsearch中的字段类型一一讲解清楚。

上文中介绍了mapping的基本概念,对于Mysql数据库而言,Elasticsearch中的Mapping相当于数据库的表结构,也就是各个字段定义,包括字段名称、类型,分词、是否创建索引等属性。

2、Elasticsearch 常用数据类型
2.1、自动映射数据类型

当我们创建完索引,向索引中写入新数据,Elasticsearch 会根据字段的值来推断字段类型,进而自动创建并指定对应字段类型。主要有以下规则:

|-------------|----------------|
| 写入的字段类型 | 推断字段类型 |
| true/false | boolean |
| 小数 | float |
| 数字 | long |
| 日期字符串 | date |
| 数字类型的字符串 | float/long |
| object | object |
| 数组([...]) | 取决于数组第一个元素类型 |
| 其他字符串 | text + keyword |

注: 在使用动态映射的时候,Elasticsearch会使用更宽类型去匹配,为了避免空间浪费,尽可能使用手动映射,不使用自动映射。

2.2、手动映射数据类型

手动映射是指在创建索引时指定索引中每个字段类型、分词器等参数(类似于建表语句中指定字段名、字段类型等)。下面是一些常用的数据类型,随着学习深入将介绍更短复杂的数据类型。

|-----------|--------------------------|
| 字段类型 | 说明 |
| long | 八个字节有符号整数 |
| integer | 四个字节有符号整数 |
| float | 四字节单精度浮点数 |
| double | 八字节双精度浮点数 |
| short | 两个字节(有符号整型:-32768-32767) |
| byte | 一个字节(有符号整型:-128-127) |
| boolean | 布尔类型 |
| text | 文本数据类型,用于全文检索 |
| date | 日期 |
| keyword | 精确匹配类型:一般用于精确匹配和聚合字段 |
| object | 值为 json 对象(object 类型) |
| nested | 嵌套类型 |
| geo_point | 地理位置(经度,纬度) |
| geo_point | 多边形 |

3、手动定义Mapping
3.1、自定义映射

常用定义映射操作如下:

bash 复制代码
PUT /<index_name>
{
  "mappings": {
    "properties": {
      "field_a": {
        "<parameter_name>": "<parameter_value>",
        "index": false,  # 是否创建索引(是否支持被检索),默认为true
        "analyzer":"ik_smart",  # 指定分词器,只有text类型的支持
        "coerce": false,  # 是否允许强制类型转换, 例如:"1" => 1,只在数字类型支持
        "copy_to": "all",  # 将该字段拷贝到all中,可以多个字段都拷贝到all,可以实现聚合查询
        "format":"yyyy-MM-dd"  # 常用于日期格式化
      }, 
      "name":{                
          "properties":{
             "firstName":{
                "type":"keyword",
                "ignore_above": 512  # 长度超过会被忽略,数据会保存,但查询不到
             }
          }
       },
        "all":{                
          "type":"text",
          "analyzer":"ik_smart"
       }
      ...
    }
  }
}
3.2、查看创建的映射
bash 复制代码
# 1、查看完整的索引 mapping
GET /<index_name>/_mappings
# 2、查看索引中指定字段的 mapping
GET /<index_name>/_mappings/field/<field_name>
3.3、修改映射属性

注:并非所有映射属性都可以修改,字段类型不可修改,分词器不可修改,是否支持倒排索引不可修改等。

bash 复制代码
PUT <index_name>/_mapping
{
  "properties": {
    "<field_name>": {
      "type": "text",	// 必须和原字段类型相同,而且必须显式声明
      "analyzer":"ik_master"	// 必须和原分词器类型相同,而且必须显式声明
    }
  }
}
4、总结

本文简要介绍Elasticsearch中的mapping的基本概念和使用,后续将更加细致说明如何更加高效创建mapping和更加高效使用Elasticsearch。

相关推荐
T062051410 分钟前
【面板数据】地级市及区县人口空心化数据(2000-2024年)
大数据
Aktx20FNz1 小时前
iFlow CLI 完整工作流指南
大数据·elasticsearch·搜索引擎
LaughingZhu2 小时前
Anthropic 收购 Oven 后,Claude Code 用运行时写了一篇护城河文章
大数据·人工智能·经验分享·搜索引擎·语音识别
学习3人组2 小时前
TortoiseGit冲突解决实战上机练习
大数据·elasticsearch·搜索引擎
Ln5x9qZC22 小时前
Flink SQL 元数据持久化实战
大数据·sql·flink
OYpBNTQXi2 小时前
Flink Agents 源码解读 --- (6) --- ActionTask
大数据·flink
A__tao3 小时前
Elasticsearch Mapping 一键生成 Go Struct,支持嵌套解析
elasticsearch·es
中金快讯3 小时前
济民健康医疗服务占比提升至46%!业务结构调整初见成效
大数据·人工智能
lizhihai_993 小时前
股市学习心得-尾盘半小时买入法
大数据
大大大大晴天️4 小时前
Hudi 生产问题排障-乱序Upsert入湖数据丢失
大数据·flink·hudi