[Hive] lateral view explode

当在Hive中使用 LATERAL VIEW EXPLODE 时,

它用于将一个复杂类型(如数组或Map)的列展开成多行数据,

并将这些展开后的数据与其他列进行关联。


下面是一个简单的例子来解释 LATERAL VIEW EXPLODE 的用法:

假设有一个包含学生姓名和对应课程的表格 student_courses,其中的列 courses 是一个数组类型,表示学生所选修的课程。

复制代码
+---------+----------------------------+
| student |          courses           |
+---------+----------------------------+
|   Alice | [Math, Science, History]   |
|    Bob  | [English, Geography]       |
+---------+----------------------------+

现在我们想要将每个学生选修的课程展开成多行数据。可以使用 LATERAL VIEW EXPLODE 来实现这一点。

查询语句如下:

sql 复制代码
SELECT student, course
FROM student_courses
LATERAL VIEW EXPLODE(courses) exploded AS course;

结果将会是:

复制代码
+---------+---------+
| student |  course |
+---------+---------+
|   Alice |   Math  |
|   Alice | Science |
|   Alice | History |
|    Bob  | English |
|    Bob  |Geography|
+---------+---------+

通过 LATERAL VIEW EXPLODE,我们将每个学生的课程数组展开成了多行数据,并与原始表格的其他列保持关联。这样,我们可以更方便地处理每个学生的每门课程信息。

需要注意的是,在使用 LATERAL VIEW EXPLODE 时,

需要在表格名称后面使用别名(如上例中的 "exploded"),

以便将展开后的数据与其他列进行关联。

这样,我们可以在查询中引用新生成的列

相关推荐
虚幻如影29 分钟前
Hive 中“STRING类型无需显式指定长度
数据仓库·hive·hadoop
荒川之神10 小时前
Oracle 数据仓库雪花模型设计(完整实战方案)
数据库·数据仓库·oracle
RestCloud12 小时前
2026年企业级ETL工具选型指南:从开源DataX到商业化ETLCloud的演进
数据仓库·开源·etl·datax·数据处理·数据集成·数据传输
荒川之神12 小时前
Oracle 数据仓库星座模型(Galaxy Model)设计原则
数据库·数据仓库·oracle
瀚高PG实验室14 小时前
ETL中,分区表子表未及时收集统计信息,导致sql执行耗时很长
数据库·数据仓库·sql·etl·瀚高数据库
仗剑_走天涯14 小时前
hadoop reduce阶段 对象重用问题
大数据·hadoop·分布式
荒川之神15 小时前
Oracle 数据仓库雪花模型设计原则(核心 + 落地 + Oracle 数据库适配)
数据库·数据仓库·oracle
荒川之神15 小时前
Oracle 数据仓库星型模型设计原则
数据库·数据仓库·oracle
仗剑_走天涯16 小时前
hadoop 中 yarn node -list 显示0 问题解决
大数据·hadoop·分布式
武子康2 天前
大数据-263 实时数仓-Canal 增量订阅与消费原理:MySQL Binlog 数据同步实践
大数据·hadoop·后端