【大数据面试题】38 说说 Hive 怎么行转列

一步一个脚印,一天一道大数据面试题
博主希望能够得到大家的点赞收藏支持!非常感谢

点赞,收藏是情分,不点是本分。祝你身体健康,事事顺心!

行转列

假设我们有一张名为 sales_data 的表,其中包含 product_id(产品 ID)、category(类别)和 sales_amount(销售金额)这几列的数据。

步骤:

  1. group by id
  2. 聚合函数sum/max/min,里面套一个 if / case when
  3. as 列名

样例数据:

sql 复制代码
-- 样例 SQL
SELECT * FROM students;
+-----------+------------+-------------+
| stu_id    | subject    | score       |
+-----------+------------+-------------+
| 1         | Chinese    | 80          |
| 1         | Math       | 70          |
| 1         | English    | 75          |
| 2         | Chinese    | 77          |
| 2         | Math       | 60          |
| 2         | English    | 80          |
+-----------+------------+-------------+

开始行转列:

sql 复制代码
SELECT stu_id,
       SUM(IF(subject = 'Chinese', score, 0) AS chinese_score),
       SUM(IF(subject = 'Math', score, 0) AS math_score),
       SUM(IF(subject = 'English', score, 0) AS english_score)
FROM students
GROUP BY stu_id;

+-----------+--------------+-------------+---------------+
| stu_id    | chinese_score| math_score  | english_score |
+-----------+--------------+-------------+---------------+
| 1         | 80           | 70          | 75            |
| 2         | 77           | 60          | 80            |
+-----------+--------------+-------------+---------------+

我是近未来,祝你变得更强!

相关推荐
chushiyunen2 分钟前
elasticsearch查询相关
大数据·elasticsearch·搜索引擎
段一凡-华北理工大学15 分钟前
工业领域的Hadoop架构学习~系列文章16:实时流处理架构 - 工业数据的实时动脉
大数据·数据仓库·hadoop·分布式·学习·架构·高炉炼铁
yyuuuzz21 分钟前
aws亚马逊云服务的基础认知与常见场景
大数据·运维·服务器·网络·云计算·aws
Data-Miner24 分钟前
休闲食品数据分析平台建设方案,70页ppt全解析
大数据·人工智能·数据分析
河北清兮网络科技26 分钟前
2026石家庄广告联盟APP开发成本明细|不同开发模式费用拆解
大数据·小程序·app·短剧app·广告联盟
Aloudata30 分钟前
宽表 vs 语义层:论 AI 时代语义编织对智能数据分析的重要性
大数据·人工智能·数据挖掘·数据分析·agent·语义层·语义编织
工业胶粘剂技术36 分钟前
工业胶粘剂选型指南:东莞科耀26款TDS型号与应用场景整理
大数据
老H科研技术44 分钟前
第 02 篇:5 分钟搭建第一个 MCP 服务器
大数据·运维·服务器·人工智能·学习·aigc·ai编程
商业模式源码开发1 小时前
餐饮实体商业模式拆解:推三享一与异业联盟的合规落地架构
大数据·架构·异业联盟·私域流量·推三返一·商业观察
醉颜凉1 小时前
Scala自定义Monad实战:从理论到应用的完整指南
大数据·算法·scala