Elasticsearch 基础之映射(mappping)

1、简介

在上文中我们介绍了Elasticsearch对于索引和文档的基本操作,虽然掌握了如何对于索引中的文档增删改查操作,但是对于文档中的字段类型如何定义,以及字段索引是如何进行分词操作都不甚了解,本文介绍Elasticsearch中的映射概念,将Elasticsearch中的字段类型一一讲解清楚。

上文中介绍了mapping的基本概念,对于Mysql数据库而言,Elasticsearch中的Mapping相当于数据库的表结构,也就是各个字段定义,包括字段名称、类型,分词、是否创建索引等属性。

2、Elasticsearch 常用数据类型
2.1、自动映射数据类型

当我们创建完索引,向索引中写入新数据,Elasticsearch 会根据字段的值来推断字段类型,进而自动创建并指定对应字段类型。主要有以下规则:

|-------------|----------------|
| 写入的字段类型 | 推断字段类型 |
| true/false | boolean |
| 小数 | float |
| 数字 | long |
| 日期字符串 | date |
| 数字类型的字符串 | float/long |
| object | object |
| 数组(...) | 取决于数组第一个元素类型 |
| 其他字符串 | text + keyword |

注: 在使用动态映射的时候,Elasticsearch会使用更宽类型去匹配,为了避免空间浪费,尽可能使用手动映射,不使用自动映射。

2.2、手动映射数据类型

手动映射是指在创建索引时指定索引中每个字段类型、分词器等参数(类似于建表语句中指定字段名、字段类型等)。下面是一些常用的数据类型,随着学习深入将介绍更短复杂的数据类型。

|-----------|--------------------------|
| 字段类型 | 说明 |
| long | 八个字节有符号整数 |
| integer | 四个字节有符号整数 |
| float | 四字节单精度浮点数 |
| double | 八字节双精度浮点数 |
| short | 两个字节(有符号整型:-32768-32767) |
| byte | 一个字节(有符号整型:-128-127) |
| boolean | 布尔类型 |
| text | 文本数据类型,用于全文检索 |
| date | 日期 |
| keyword | 精确匹配类型:一般用于精确匹配和聚合字段 |
| object | 值为 json 对象(object 类型) |
| nested | 嵌套类型 |
| geo_point | 地理位置(经度,纬度) |
| geo_point | 多边形 |

3、手动定义Mapping
3.1、自定义映射

常用定义映射操作如下:

bash 复制代码
PUT /<index_name>
{
  "mappings": {
    "properties": {
      "field_a": {
        "<parameter_name>": "<parameter_value>",
        "index": false,  # 是否创建索引(是否支持被检索),默认为true
        "analyzer":"ik_smart",  # 指定分词器,只有text类型的支持
        "coerce": false,  # 是否允许强制类型转换, 例如:"1" => 1,只在数字类型支持
        "copy_to": "all",  # 将该字段拷贝到all中,可以多个字段都拷贝到all,可以实现聚合查询
        "format":"yyyy-MM-dd"  # 常用于日期格式化
      }, 
      "name":{                
          "properties":{
             "firstName":{
                "type":"keyword",
                "ignore_above": 512  # 长度超过会被忽略,数据会保存,但查询不到
             }
          }
       },
        "all":{                
          "type":"text",
          "analyzer":"ik_smart"
       }
      ...
    }
  }
}
3.2、查看创建的映射
bash 复制代码
# 1、查看完整的索引 mapping
GET /<index_name>/_mappings
# 2、查看索引中指定字段的 mapping
GET /<index_name>/_mappings/field/<field_name>
3.3、修改映射属性

注:并非所有映射属性都可以修改,字段类型不可修改,分词器不可修改,是否支持倒排索引不可修改等。

bash 复制代码
PUT <index_name>/_mapping
{
  "properties": {
    "<field_name>": {
      "type": "text",	// 必须和原字段类型相同,而且必须显式声明
      "analyzer":"ik_master"	// 必须和原分词器类型相同,而且必须显式声明
    }
  }
}
4、总结

本文简要介绍Elasticsearch中的mapping的基本概念和使用,后续将更加细致说明如何更加高效创建mapping和更加高效使用Elasticsearch。

相关推荐
老陈头聊SEO26 分钟前
生成引擎优化(GEO)引领内容创作效率与质量的新纪元
其他·搜索引擎·seo优化
极创信息2 小时前
Linux挖矿病毒深度清理实战教程,从进程隐藏、Rootkit驻留到彻底根除
java·大数据·linux·运维·安全·tomcat·健康医疗
SEO_juper2 小时前
Semrush 蓝海关键词筛选,AI 一键拓展完整词库
大数据·谷歌·seo·geo·gemini·询盘·b2b
阿 才4 小时前
跟文件系统(busybox)的构建
大数据·hadoop·分布式
宁波鹿语心理4 小时前
过度卷入的三角化:养育者情感投射对青少年自我边界形成的结构性影响及干预路径
大数据
逐米时代4 小时前
制造型企业AI智能体实施步骤详解:提升协同效率的实战指南
大数据·人工智能
大嘴皮猴儿4 小时前
跨境电商运营笔记:我是如何用工具解决多语言素材问题的
大数据·人工智能·新媒体运营·自动翻译·教育电商
赤龙ERP4 小时前
赤龙一周观察 · 6月第2周
大数据·人工智能·ai·erp
JGDT_5 小时前
ERP重塑与未来趋势:SAP的实践及大一统格局(上)
大数据·人工智能·安全·架构·开源
ACP广源盛139246256735 小时前
IX7008 PCIe 交换芯片@ACP#RTX Spark 经济型 8 口扩展芯片(对比 ASM1806)
大数据·人工智能·分布式·嵌入式硬件·gpt·spark·电脑