Elasticsearch 基础之映射(mappping)

1、简介

在上文中我们介绍了Elasticsearch对于索引和文档的基本操作,虽然掌握了如何对于索引中的文档增删改查操作,但是对于文档中的字段类型如何定义,以及字段索引是如何进行分词操作都不甚了解,本文介绍Elasticsearch中的映射概念,将Elasticsearch中的字段类型一一讲解清楚。

上文中介绍了mapping的基本概念,对于Mysql数据库而言,Elasticsearch中的Mapping相当于数据库的表结构,也就是各个字段定义,包括字段名称、类型,分词、是否创建索引等属性。

2、Elasticsearch 常用数据类型
2.1、自动映射数据类型

当我们创建完索引,向索引中写入新数据,Elasticsearch 会根据字段的值来推断字段类型,进而自动创建并指定对应字段类型。主要有以下规则:

|-------------|----------------|
| 写入的字段类型 | 推断字段类型 |
| true/false | boolean |
| 小数 | float |
| 数字 | long |
| 日期字符串 | date |
| 数字类型的字符串 | float/long |
| object | object |
| 数组([...]) | 取决于数组第一个元素类型 |
| 其他字符串 | text + keyword |

注: 在使用动态映射的时候,Elasticsearch会使用更宽类型去匹配,为了避免空间浪费,尽可能使用手动映射,不使用自动映射。

2.2、手动映射数据类型

手动映射是指在创建索引时指定索引中每个字段类型、分词器等参数(类似于建表语句中指定字段名、字段类型等)。下面是一些常用的数据类型,随着学习深入将介绍更短复杂的数据类型。

|-----------|--------------------------|
| 字段类型 | 说明 |
| long | 八个字节有符号整数 |
| integer | 四个字节有符号整数 |
| float | 四字节单精度浮点数 |
| double | 八字节双精度浮点数 |
| short | 两个字节(有符号整型:-32768-32767) |
| byte | 一个字节(有符号整型:-128-127) |
| boolean | 布尔类型 |
| text | 文本数据类型,用于全文检索 |
| date | 日期 |
| keyword | 精确匹配类型:一般用于精确匹配和聚合字段 |
| object | 值为 json 对象(object 类型) |
| nested | 嵌套类型 |
| geo_point | 地理位置(经度,纬度) |
| geo_point | 多边形 |

3、手动定义Mapping
3.1、自定义映射

常用定义映射操作如下:

bash 复制代码
PUT /<index_name>
{
  "mappings": {
    "properties": {
      "field_a": {
        "<parameter_name>": "<parameter_value>",
        "index": false,  # 是否创建索引(是否支持被检索),默认为true
        "analyzer":"ik_smart",  # 指定分词器,只有text类型的支持
        "coerce": false,  # 是否允许强制类型转换, 例如:"1" => 1,只在数字类型支持
        "copy_to": "all",  # 将该字段拷贝到all中,可以多个字段都拷贝到all,可以实现聚合查询
        "format":"yyyy-MM-dd"  # 常用于日期格式化
      }, 
      "name":{                
          "properties":{
             "firstName":{
                "type":"keyword",
                "ignore_above": 512  # 长度超过会被忽略,数据会保存,但查询不到
             }
          }
       },
        "all":{                
          "type":"text",
          "analyzer":"ik_smart"
       }
      ...
    }
  }
}
3.2、查看创建的映射
bash 复制代码
# 1、查看完整的索引 mapping
GET /<index_name>/_mappings
# 2、查看索引中指定字段的 mapping
GET /<index_name>/_mappings/field/<field_name>
3.3、修改映射属性

注:并非所有映射属性都可以修改,字段类型不可修改,分词器不可修改,是否支持倒排索引不可修改等。

bash 复制代码
PUT <index_name>/_mapping
{
  "properties": {
    "<field_name>": {
      "type": "text",	// 必须和原字段类型相同,而且必须显式声明
      "analyzer":"ik_master"	// 必须和原分词器类型相同,而且必须显式声明
    }
  }
}
4、总结

本文简要介绍Elasticsearch中的mapping的基本概念和使用,后续将更加细致说明如何更加高效创建mapping和更加高效使用Elasticsearch。

相关推荐
Guheyunyi1 天前
智能守护:视频安全监测系统的演进与未来
大数据·人工智能·科技·安全·信息可视化
发哥来了1 天前
主流AI视频生成商用方案选型评测:五大核心维度对比分析
大数据·人工智能
数研小生1 天前
做京东评论分析系统11年,京东评论数据接口解析
大数据
金融小师妹1 天前
基于LSTM-GARCH-EVT混合模型的贵金属极端波动解析:黄金白银双双反弹的逻辑验证
大数据·人工智能·深度学习·机器学习
yumgpkpm1 天前
2026软件:白嫖,开源,外包,招标,晚进场(2025年下半年),数科,AI...中国的企业软件产业出路
大数据·人工智能·hadoop·算法·kafka·开源·cloudera
xixixi777771 天前
今日 AI 、通信、安全行业前沿日报(2026 年 2 月 4 日,星期三)
大数据·人工智能·安全·ai·大模型·通信·卫星通信
珠海西格1 天前
1MW光伏项目“四可”装置改造:逆变器兼容性评估方法详解
大数据·运维·服务器·云计算·能源
迎仔1 天前
13-云原生大数据架构介绍:大数据世界的“弹性城市”
大数据·云原生·架构
产品人卫朋1 天前
卫朋:IPD流程落地 - 市场地图拆解篇
大数据·人工智能·物联网
TDengine (老段)1 天前
通过云服务 快速体验 TDengine
大数据·数据库·物联网·时序数据库·tdengine·涛思数据·iotdb