【HBZ分享】ES中的Mapping的数据类型 及 类型的特点

Mapping类型

  1. Numeric: 包括整数类型(long, integer, short, byte) 和 浮点类型(double, float)
  2. Date: 用于存储日期和时间类型
  3. Boolean:用于存储布尔类型(true, false)
  4. Binary: 用于存储二进制类型数据
  5. Array: 用于存储数组或列表类型数据
  6. Object: 用于存储复杂结构类型数据

常见并且很关键的数据类型

  1. text字段类型:

    (1). text类型主要用于全文本搜索,适合存储需要进行全文本分词的文本内容,比如文章,新闻,描述等。

    (2). text字段会对文本内容进行分词处理,将文本拆分成独立的词项进行搜索

    (3). 分词的结果会建立倒排索引,使搜索更加灵活高效

    (4). text字段在搜索时会根据分词结果进行匹配,并计算出相关得分,以便返回最佳结果

  2. keyword字段类型:

    (1). keyword类型主要用于精确匹配和聚合操作, 适合存储不需要分词的精确值,比如ID, 标签等

    (2). keyword类型的字段不会进行分词处理,而是将整一个字段作为整体进行搜索,差一个单词都搜不出来

    (3). 不能进行模糊查询

    (4). keyword字段适合用于过滤和精准匹配,同时可以进行快速的基于精确值的聚合操作

  3. 总节:

    (1). 在选择text还是keyword类型时, 需要根据具体需求来衡量选择,看这个字段能不能做模糊查询,如果要做模糊查询,那就用text字段

    (2). 如果需要全文本搜索,并且希望根据分词进行模糊查询,并得到匹配得分,就用text

    (3). 如需精确匹配,排序或者聚合操作,并且不会对该字段进行模糊查询,比如身份证号等关键信息,则选择keyword类型

ES配置字段类型相关的命令

复制代码
该命令时在kibana中使用的,如果时postman,请加上http://ip:port/


1. 创建索引,并指定字段的类型
PUT /my_index
{
  "mappings": {
    "properties": {
      "title": {
        "type": "text"
      },
      "tags": {
        "type": "keyword"
      },
      "publish_date": {
        "type": "date"
      },
      "rating": {
        "type": "float"
      },
      "is_published": {
        "type": "boolean"
      },
      "author": {
        "properties": {
          "name": {
            "type": "text"
          },
          "age": {
            "type": "integer"
          }
        }
      },
      "comments": {
        "type": "nested",
        "properties": {
          "user": {
            "type": "keyword"
          },
          "message": {
            "type": "text"
          }
        }
      }
    }
  }
}


插入对应数据,并使es本身自带的_id为1
POST /my_index/_doc/1
{
  "title": "小滴课堂最近上线了新课 Elasticsearch Introduction",
  "tags": ["search", "big data", "distributed system", "小滴课堂"],
  "publish_date": "2025-01-01",
  "rating": 4.5,
  "is_published": true,
  "author": {
    "name": "John Doe",
    "age": 30
  },
  "comments": [
    {
      "user": "Alice",
      "message": "Great article!"
    },
    {
      "user": "Bob",
      "message": "Very informative."
    }
  ]
}



2. 查询title字段,并模糊匹配关键字, title是text类型的
GET /my_index/_search
{
  "query": {
    "match": {
      "title": "Elasticsearch"
    }
  }
}


3. 查询tags字段,并精准匹配数组中的某个值,tags是keyword类型的
GET /my_index/_search
{
  "query": {
    "match": {
      "tags": "big data"
    }
  }
}
相关推荐
运维成长记35 分钟前
mysql数据库-中间件MyCat
数据库·mysql·中间件
尘客.1 小时前
DataX从Mysql导数据到Hive分区表案例
数据库·hive·mysql
一只专注api接口开发的技术猿1 小时前
企业级电商数据对接:1688 商品详情 API 接口开发与优化实践
大数据·前端·爬虫
TiDB 社区干货传送门2 小时前
从开发者角度看数据库架构进化史:JDBC - 中间件 - TiDB
数据库·oracle·中间件·tidb·数据库架构
虾球xz2 小时前
游戏引擎学习第280天:精简化的流式实体sim
数据库·c++·学习·游戏引擎
uwvwko3 小时前
BUUCTF——web刷题第一页题解
android·前端·数据库·php·web·ctf
今天我又学废了3 小时前
Spark,SparkSQL操作Mysql, 创建数据库和表
大数据·mysql·spark
扶尔魔ocy3 小时前
【Linux C/C++开发】轻量级关系型数据库SQLite开发(包含性能测试代码)
linux·数据库·c++·sqlite
旋风菠萝3 小时前
项目复习(1)
java·数据库·八股·八股文·复习·项目、
w23617346013 小时前
Django框架漏洞深度剖析:从漏洞原理到企业级防御实战指南——为什么你的Django项目总被黑客盯上?
数据库·django·sqlite