ElasticSearch-Nested 类型与 Object 类型的区别

在 Elasticsearch 中,nested 类型和 object 类型都用于处理嵌套的 JSON 数据,但它们在存储和查询方面有着显著的区别。本文将详细解释这两种类型的区别,并提供具体的示例。

一、基本概念

1. object 类型

  • 定义object 类型是 Elasticsearch 默认的嵌套类型,用于表示 JSON 对象。Elasticsearch 会自动将 object 类型的字段展平存储。

  • 存储方式 :Elasticsearch 会将 object 类型的字段展平,存储为多个独立的字段。例如,一个包含多个属性的对象数组会被展平为多个数组字段。

  • 查询方式 :可以直接使用普通的查询语句,通过点号(.)连接字段路径进行查询。

2. nested 类型

  • 定义nested 类型是一种特殊的 object 类型,每个嵌套对象会被索引为一个独立的隐藏文档。这允许对嵌套对象进行精确的查询和过滤。

  • 存储方式:每个嵌套对象被索引为一个独立的文档,存储时保持了对象的独立性。

  • 查询方式 :需要使用 nested 查询来查询嵌套对象。

二、具体区别

1. 存储方式

  • object 类型 :Elasticsearch 会将 object 类型的字段展平存储。例如,一个包含多个属性的对象数组会被展平为多个数组字段。这种展平存储方式可能会导致一些查询问题,特别是当需要对嵌套对象进行精确查询时。
  • nested 类型:每个嵌套对象被索引为一个独立的文档,存储时保持了对象的独立性。这使得对嵌套对象的查询更加精确和灵活。

2. 查询方式

  • object 类型 :可以直接使用普通的查询语句,通过点号(.)连接字段路径进行查询。
bash 复制代码
{
  "query": {
    "term": {
      "inspector.id": {
        "value": "222"
      }
    }
  }
}
  • nested 类型 :需要使用 nested 查询来查询嵌套对象。
bash 复制代码
{
  "query": {
    "nested": {
      "path": "inspector",
      "query": {
        "term": {
          "inspector.id": {
            "value": "222"
          }
        }
      }
    }
  }
}

3. 查询结果

  • object 类型 :由于 object 类型的字段被展平存储,有时会导致"且"查询变成"或"查询。例如,查询同时包含"欧莱雅"和"美白"的文档时,可能会返回不正确的结果。
  • nested 类型nested 类型的查询可以精确地匹配嵌套对象,避免了上述问题。例如,查询同时包含"欧莱雅"和"美白"的文档时,不会返回任何结果,因为没有任何一个嵌套对象同时具备这两个属性。

四、总结

  • object 类型:适用于简单的嵌套结构,数据被展平存储,不支持复杂的嵌套查询。
  • nested 类型:适用于需要复杂查询的嵌套结构,支持对嵌套对象的精确查询和过滤。

根据具体的业务需求选择合适的数据类型,以优化查询性能和数据建模的复杂性。如果需要对嵌套对象进行精确的查询和过滤,建议使用 nested 类型。如果嵌套结构简单,且不需要复杂的查询,可以使用 object 类型。

相关推荐
数据与人工智能律师9 分钟前
解码Web3:DeFi、GameFi、SocialFi的法律风险警示与合规路径
大数据·网络·人工智能·云计算·区块链
arvin_xiaoting25 分钟前
#zsh# #Ubuntu# 一键安装zsh、oh-my-zsh、常用插件
linux·ubuntu·elasticsearch
九河云1 小时前
TOS + 数字孪生:集装箱码头的智能进化密码
大数据·服务器·网络·数据库·数字化转型
说私域1 小时前
开源链动2+1模式AI智能名片S2B2C商城小程序在竞争激烈的中低端面膜服装行业中的应用与策略
大数据·人工智能·小程序
bemyrunningdog1 小时前
IntelliJ IDEA合并分支到master全攻略
大数据·elasticsearch·intellij-idea
孟意昶1 小时前
Doris专题17- 数据导入-文件格式
大数据·数据库·分布式·sql·doris
星光一影2 小时前
Java版小区物业管理系统/业主端/物业端/管理端/支持公众号、小程序、app
java·大数据·小程序
武子康2 小时前
大数据-125 - Flink 实时流计算中的动态逻辑更新:广播状态(Broadcast State)全解析
大数据·后端·flink
数在表哥2 小时前
从数据沼泽到智能决策:数据驱动与AI融合的中台建设方法论与技术实践指南(一)
大数据·人工智能
dessler3 小时前
Elasticsearch(ES)分片(Shard)和 副本分片(Replica Shard)
linux·运维·elasticsearch