Elasticsearch 基础之映射(mappping)

1、简介

在上文中我们介绍了Elasticsearch对于索引和文档的基本操作,虽然掌握了如何对于索引中的文档增删改查操作,但是对于文档中的字段类型如何定义,以及字段索引是如何进行分词操作都不甚了解,本文介绍Elasticsearch中的映射概念,将Elasticsearch中的字段类型一一讲解清楚。

上文中介绍了mapping的基本概念,对于Mysql数据库而言,Elasticsearch中的Mapping相当于数据库的表结构,也就是各个字段定义,包括字段名称、类型,分词、是否创建索引等属性。

2、Elasticsearch 常用数据类型
2.1、自动映射数据类型

当我们创建完索引,向索引中写入新数据,Elasticsearch 会根据字段的值来推断字段类型,进而自动创建并指定对应字段类型。主要有以下规则:

|-------------|----------------|
| 写入的字段类型 | 推断字段类型 |
| true/false | boolean |
| 小数 | float |
| 数字 | long |
| 日期字符串 | date |
| 数字类型的字符串 | float/long |
| object | object |
| 数组([...]) | 取决于数组第一个元素类型 |
| 其他字符串 | text + keyword |

注: 在使用动态映射的时候,Elasticsearch会使用更宽类型去匹配,为了避免空间浪费,尽可能使用手动映射,不使用自动映射。

2.2、手动映射数据类型

手动映射是指在创建索引时指定索引中每个字段类型、分词器等参数(类似于建表语句中指定字段名、字段类型等)。下面是一些常用的数据类型,随着学习深入将介绍更短复杂的数据类型。

|-----------|--------------------------|
| 字段类型 | 说明 |
| long | 八个字节有符号整数 |
| integer | 四个字节有符号整数 |
| float | 四字节单精度浮点数 |
| double | 八字节双精度浮点数 |
| short | 两个字节(有符号整型:-32768-32767) |
| byte | 一个字节(有符号整型:-128-127) |
| boolean | 布尔类型 |
| text | 文本数据类型,用于全文检索 |
| date | 日期 |
| keyword | 精确匹配类型:一般用于精确匹配和聚合字段 |
| object | 值为 json 对象(object 类型) |
| nested | 嵌套类型 |
| geo_point | 地理位置(经度,纬度) |
| geo_point | 多边形 |

3、手动定义Mapping
3.1、自定义映射

常用定义映射操作如下:

bash 复制代码
PUT /<index_name>
{
  "mappings": {
    "properties": {
      "field_a": {
        "<parameter_name>": "<parameter_value>",
        "index": false,  # 是否创建索引(是否支持被检索),默认为true
        "analyzer":"ik_smart",  # 指定分词器,只有text类型的支持
        "coerce": false,  # 是否允许强制类型转换, 例如:"1" => 1,只在数字类型支持
        "copy_to": "all",  # 将该字段拷贝到all中,可以多个字段都拷贝到all,可以实现聚合查询
        "format":"yyyy-MM-dd"  # 常用于日期格式化
      }, 
      "name":{                
          "properties":{
             "firstName":{
                "type":"keyword",
                "ignore_above": 512  # 长度超过会被忽略,数据会保存,但查询不到
             }
          }
       },
        "all":{                
          "type":"text",
          "analyzer":"ik_smart"
       }
      ...
    }
  }
}
3.2、查看创建的映射
bash 复制代码
# 1、查看完整的索引 mapping
GET /<index_name>/_mappings
# 2、查看索引中指定字段的 mapping
GET /<index_name>/_mappings/field/<field_name>
3.3、修改映射属性

注:并非所有映射属性都可以修改,字段类型不可修改,分词器不可修改,是否支持倒排索引不可修改等。

bash 复制代码
PUT <index_name>/_mapping
{
  "properties": {
    "<field_name>": {
      "type": "text",	// 必须和原字段类型相同,而且必须显式声明
      "analyzer":"ik_master"	// 必须和原分词器类型相同,而且必须显式声明
    }
  }
}
4、总结

本文简要介绍Elasticsearch中的mapping的基本概念和使用,后续将更加细致说明如何更加高效创建mapping和更加高效使用Elasticsearch。

相关推荐
WeeJot嵌入式13 分钟前
大数据治理:确保数据的可持续性和价值
大数据
晨欣29 分钟前
Elasticsearch和Lucene之间是什么关系?(ChatGPT回答)
elasticsearch·chatgpt·lucene
zmd-zk1 小时前
kafka+zookeeper的搭建
大数据·分布式·zookeeper·中间件·kafka
激流丶1 小时前
【Kafka 实战】如何解决Kafka Topic数量过多带来的性能问题?
java·大数据·kafka·topic
测试界的酸菜鱼1 小时前
Python 大数据展示屏实例
大数据·开发语言·python
时差9532 小时前
【面试题】Hive 查询:如何查找用户连续三天登录的记录
大数据·数据库·hive·sql·面试·database
Mephisto.java2 小时前
【大数据学习 | kafka高级部分】kafka中的选举机制
大数据·学习·kafka
Mephisto.java2 小时前
【大数据学习 | kafka高级部分】kafka的优化参数整理
大数据·sql·oracle·kafka·json·database
道可云2 小时前
道可云人工智能&元宇宙每日资讯|2024国际虚拟现实创新大会将在青岛举办
大数据·人工智能·3d·机器人·ar·vr
成都古河云2 小时前
智慧场馆:安全、节能与智能化管理的未来
大数据·运维·人工智能·安全·智慧城市