[Hive] Map类型在表中是如何存储的

在 Hive 中，Map 类型是指键值对的集合，其中键和值都可以是任意数据类型。

在 Hive 表中，Map 类型通常被存储为结构体或者键值对列表。

具体来说，在表中，Map 类型通常分为以下两种存储方式：

文章目录

- 结构体存储方式
- 键值对列表存储方式

结构体存储方式

当 Map 类型作为单个列时，可以使用结构体（Structs）的存储方式来存储 Map 类型。这种方式下，Hive 会将 Map 类型转换成一个包含 key、value 字段的结构体，然后将结构体作为表中的一列进行存储。

例如，下面的 DDL 语句定义了一个包含 Map 类型的表 my_table：

sql 复制代码

CREATE TABLE my_table (
  id INT,
  name STRING,
  properties MAP<STRING, INT>
)

在上述例子中，properties 列的类型是 MAP<STRING, INT>，即键类型为 STRING，值类型为 INT 的 Map 类型。在该表中，Map 类型会被转换成一个包含 key 和 value 字段的结构体，然后存储在 properties 列中。在查询时，可以通过点符号来访问 Map 类型中的键和值，例如：

sql 复制代码

SELECT properties.key, properties.value
FROM my_table

键值对列表存储方式

当 Map 类型作为表中的嵌套列时，通常使用键值对列表的存储方式来存储 Map 类型。

这种方式下，Hive 会将 Map 类型转换成一个键值对列表，然后将该列表作为表中的一列进行存储。

例如，下面的 DDL 语句定义了一个包含 Map 类型的嵌套表 my_table：

sql 复制代码

CREATE TABLE my_table (
  id INT,
  name STRING,
  properties STRUCT<key:STRING, value:INT>[]  
)

在上述例子中，properties 列的类型是
STRUCT<key:STRING, value:INT>[]

即一个包含键值对结构体的数组。

在该表中，Map 类型会被转换成一个包含 key、value 字段的结构体，然后将结构体添加到 properties 列的数组中进行存储。

在查询时，可以通过数组下标和点符号来访问 Map 类型中的键和值，例如：

sql 复制代码

SELECT properties[0].key, properties[0].value
FROM my_table

总之，在 Hive 中，Map 类型可以使用结构体或者键值对列表的方式进行存储。具体使用哪种方式，取决于 Map 类型是作为单个列还是作为表中的嵌套列进行存储。