hive行转列函数stack(int n, v_1, v_2, ..., v_k)

stack()函数时,参数中的键值对应按照一对列名和列值进行排使用列

stack(int n, v_1, v_2, ..., v_k)

功能:把k列数据转换成n行,k/n列,其中n必须是正整数,后面的v_1到v_k必须是元素,不能是列名。(不常用)

sql 复制代码
假设我们有一个名为employees的表,包含以下列:id, name, department, salary。

CREATE TABLE employees (
  id INT,
  name STRING,
  department STRING,
  salary DOUBLE
);

INSERT INTO employees VALUES
  (1, 'John', 'HR', 5000),
  (2, 'Jane', 'Finance', 6000),
  (3, 'Mike', 'IT', 5500);
​
现在我们使用stack()函数将每个员工的信息转换为多列:

SELECT col_index, col_value
FROM (
  SELECT stack(4,
    'id', id,
    'name', name,
    'department', department,
    'salary', salary
  ) AS (col_index, col_value)
  FROM employees
) stacked_data;
​
在这个例子中,我们使用stack()函数将每个键值对转换为多行,其中参数4指定了输出结果的行数(4行)。每个键值对由一个列名和列值组成。

然后,我们将内部查询的结果作为表别名stacked_data的数据源,并选择col_index和col_value两个列作为最终输出结果。

输出结果如下所示:

col_index	col_value
id	1
name	John
department	HR
salary	5000.0
id	2
name	Jane
department	Finance
salary	6000.0
id	3
name	Mike
department	IT
salary	5500.0
每一行表示一个转换后的记录,其中col_index列表示每个记录的列名(键),col_value列表示每个记录的列值。

参考文章

hive表生成函数explode、stack、lateral view和json_tuple、parse_url_tuple示例_hive stack-CSDN博客

相关推荐
SelectDB技术团队6 小时前
上市大模型企业数据基础设施的选择:MiniMax 基于阿里云 SelectDB 版,打造全球统一AI可观测中台
数据库·数据仓库·人工智能·ai·apache
weixin_462446236 小时前
Hive Metastore 使用 MySQL 8(CJ 驱动)完整配置实战(含完整 Shell 脚本)
hive·hadoop·mysql
zgl_200537796 小时前
源代码:ZGLanguage 解析SQL数据血缘 之 显示 MERGE SQL 结构图
数据库·数据仓库·hive·数据治理·etl·sql解析·数据血缘
Gain_chance7 小时前
24-学习笔记尚硅谷数仓搭建-DIM层的维度表建表思路及商品表维度表的具体建表解析
数据仓库·hive·笔记·学习·datagrip
编程小风筝7 小时前
MySQL数据库如何实现实现数据仓库存储?
数据库·数据仓库·mysql
talle20218 小时前
Hive | 分区与分桶
大数据·数据仓库·hive
zhangkaixuan45617 小时前
Paimon 读取数据流程深度解析
大数据·hadoop·flink·apache·paimon
Gain_chance1 天前
23-学习笔记尚硅谷数仓搭建-ODS层业务全量表、增量表结构设计及数据装载脚本
数据仓库·hive·笔记·学习
JZC_xiaozhong1 天前
什么是ETL?一文了解提取、转换与加载
数据库·数据仓库·数据分析·etl·数据一致性·数据孤岛解决方案·数据集成与应用集成
yumgpkpm1 天前
在AI语言大模型时代 Cloudera CDP(华为CMP 鲲鹏版)对自有知识的保护
人工智能·hadoop·华为·zookeeper·spark·kafka