ElasticSearch-Nested 类型与 Object 类型的区别

在 Elasticsearch 中,nested 类型和 object 类型都用于处理嵌套的 JSON 数据,但它们在存储和查询方面有着显著的区别。本文将详细解释这两种类型的区别,并提供具体的示例。

一、基本概念

1. object 类型

  • 定义object 类型是 Elasticsearch 默认的嵌套类型,用于表示 JSON 对象。Elasticsearch 会自动将 object 类型的字段展平存储。

  • 存储方式 :Elasticsearch 会将 object 类型的字段展平,存储为多个独立的字段。例如,一个包含多个属性的对象数组会被展平为多个数组字段。

  • 查询方式 :可以直接使用普通的查询语句,通过点号(.)连接字段路径进行查询。

2. nested 类型

  • 定义nested 类型是一种特殊的 object 类型,每个嵌套对象会被索引为一个独立的隐藏文档。这允许对嵌套对象进行精确的查询和过滤。

  • 存储方式:每个嵌套对象被索引为一个独立的文档,存储时保持了对象的独立性。

  • 查询方式 :需要使用 nested 查询来查询嵌套对象。

二、具体区别

1. 存储方式

  • object 类型 :Elasticsearch 会将 object 类型的字段展平存储。例如,一个包含多个属性的对象数组会被展平为多个数组字段。这种展平存储方式可能会导致一些查询问题,特别是当需要对嵌套对象进行精确查询时。
  • nested 类型:每个嵌套对象被索引为一个独立的文档,存储时保持了对象的独立性。这使得对嵌套对象的查询更加精确和灵活。

2. 查询方式

  • object 类型 :可以直接使用普通的查询语句,通过点号(.)连接字段路径进行查询。
bash 复制代码
{
  "query": {
    "term": {
      "inspector.id": {
        "value": "222"
      }
    }
  }
}
  • nested 类型 :需要使用 nested 查询来查询嵌套对象。
bash 复制代码
{
  "query": {
    "nested": {
      "path": "inspector",
      "query": {
        "term": {
          "inspector.id": {
            "value": "222"
          }
        }
      }
    }
  }
}

3. 查询结果

  • object 类型 :由于 object 类型的字段被展平存储,有时会导致"且"查询变成"或"查询。例如,查询同时包含"欧莱雅"和"美白"的文档时,可能会返回不正确的结果。
  • nested 类型nested 类型的查询可以精确地匹配嵌套对象,避免了上述问题。例如,查询同时包含"欧莱雅"和"美白"的文档时,不会返回任何结果,因为没有任何一个嵌套对象同时具备这两个属性。

四、总结

  • object 类型:适用于简单的嵌套结构,数据被展平存储,不支持复杂的嵌套查询。
  • nested 类型:适用于需要复杂查询的嵌套结构,支持对嵌套对象的精确查询和过滤。

根据具体的业务需求选择合适的数据类型,以优化查询性能和数据建模的复杂性。如果需要对嵌套对象进行精确的查询和过滤,建议使用 nested 类型。如果嵌套结构简单,且不需要复杂的查询,可以使用 object 类型。

相关推荐
代码匠心18 小时前
从零开始学Flink:数据源
java·大数据·后端·flink
Lx35220 小时前
复杂MapReduce作业设计:多阶段处理的最佳实践
大数据·hadoop
MacroZheng1 天前
横空出世!MyBatis-Plus 同款 ES ORM 框架,用起来够优雅!
java·后端·elasticsearch
武子康1 天前
大数据-100 Spark DStream 转换操作全面总结:map、reduceByKey 到 transform 的实战案例
大数据·后端·spark
expect7g1 天前
Flink KeySelector
大数据·后端·flink
极限实验室1 天前
搜索百科(1):Lucene —— 打开现代搜索世界的第一扇门
搜索引擎·lucene
阿里云大数据AI技术2 天前
StarRocks 助力数禾科技构建实时数仓:从数据孤岛到智能决策
大数据
Lx3522 天前
Hadoop数据处理优化:减少Shuffle阶段的性能损耗
大数据·hadoop
Elasticsearch2 天前
平衡尺度:利用权重使倒数排序融合 (RRF) 更加智能
elasticsearch
武子康2 天前
大数据-99 Spark Streaming 数据源全面总结:原理、应用 文件流、Socket、RDD队列流
大数据·后端·spark