实例详解构建数仓中的行列转换

本文分享自华为云社区《GaussDB数据库SQL系列-行列转换》,作者:Gauss松鼠会小助手2。

一、前言

在构建数据仓库或做数据分析时,需要对原始数据的结构进行一定的处理,有时涉及到"行转列",有时涉及到"列转行",那么这两个转换的方式具体是什么,有什么差异,怎么实现,今天我们将以GaussDB数据库为例,给大家做一下讲解。

二、简述

1、行转列概念

即将多行一列数据转为一行多列显示。通常转化后将某一列分类后的值作为新的列名,将此值对应的多行数据显示成一行。

2、列转行概念

即将一行多列数据转成多行一列显示。通常将转化后的列名为某一行中某一列的值,来识别原先对应的数据。

三、GaussDB数据库的行列转换实验示例

用一张学生成绩来举例:从老师的角度,在录入成绩时,每科老师都会单独录入每个学生的本科成绩。而从学生的角度,学生只关心自己各科的成绩分别是多少。所以如果把老师录入数据作为原始表,那么学生查看自己的成绩时就要用到行转列,如果让学生上报自己各科的成绩,然后老师去查对应学科的学生考试成绩时,那就是列转行了。

1、行转列示例

1)创建实验表(行存表)

复制代码
--创建实验表(行存表)

CREATE TABLE grade(

name VARCHAR(10)

,course VARCHAR(10)

,score INT);

--初始化测试数据

INSERT INTO grade VALUES ('张三','数学',80);

INSERT INTO grade VALUES ('张三','英语',88);

INSERT INTO grade VALUES ('张三','语文',95);

INSERT INTO grade VALUES ('李四','数学',88);

INSERT INTO grade VALUES ('李四','英语',70);

INSERT INTO grade VALUES ('李四','语文',93);

--查看结果

SELECT * FROM grade ORDER BY course;

2)静态行转列

复制代码
--静态行转列

SELECT name

,sum(case when course = '数学' then score else 0 end) AS "数学"

,sum(case when course = '英语' then score else 0 end) AS 英语

,sum(case when course = '语文' then score else 0 end) AS 语文

FROM grade

GROUP BY name;

使用sum、case when的方式:

3)行转列(结果值:拼接式)

使用listagg within group:

复制代码
--行转列(结果值:拼接式)

SELECT name, LISTAGG(score,',') WITHIN GROUP (ORDER BY course) FROM grade GROUP BY name;

4)动态行转列(拼接SQL式)

通过"listagg + 创建FUNCTION + VIEW"的方式实现

复制代码
--动态行转列(SQL拼接式)

SELECT listagg(concat('SUM(CASE WHEN course = ''', course, ''' THEN score ELSE 0 END) AS "', course,'"'),',') WITHIN GROUP(ORDER BY 1) AS concat_text FROM (SELECT DISTINCT course FROM grade);

--concat_text的结果:

SUM(CASE WHEN course = '数学' THEN score ELSE 0 END) AS "数学",SUM(CASE WHEN course = '英语' THEN score ELSE 0 END) AS "英语",SUM(CASE WHEN course = '语文' THEN score ELSE 0 END) AS "语文"

--创建一个函数。

CREATE OR REPLACE FUNCTION fun_test()

RETURNS VOID

LANGUAGE SQL

AS $$ DECLARE

s_sql text;

rec record;

BEGIN

s_sql := 'SELECT listagg(CONCAT(''SUM(CASE WHEN course = '''''', course, '''''' THEN score ELSE 0 END) AS "'', course, ''"'' ),'','' ) WITHIN GROUP(ORDER BY 1) AS concat_text FROM (SELECT DISTINCT course FROM grade);';

EXECUTE s_sql INTO rec;

s_sql := 'DROP VIEW IF EXISTS v_score; CREATE VIEW v_score AS SELECT name, ' || rec.concat_text || ' FROM grade GROUP BY name;';

EXECUTE s_sql;

END $$;

--调用

CALL fun_test();

--查看执行结果

select * from v_score;

Tip:请注意SQL拼写时的单引号、双引号。

2、列转行示例

1)创建实验表(复用前面的测试数据)

复制代码
--创建实验表(复用前面的测试数据)

CREATE TABLE grade1 AS

SELECT name

,sum(case when course = '数学' then score else 0 end) AS "数学"

,sum(case when course = '英语' then score else 0 end) AS 英语

,sum(case when course = '语文' then score else 0 end) AS 语文

FROM grade

GROUP BY name;

--查看结果
复制代码
SELECT * FROM grade1;

2)使用union all,将各科目(数学、英语、语文)整合为一列

复制代码
--使用union all,将各科目(数学、英语、语文)整合为一列

SELECT * FROM

(

SELECT name, '数学' AS course, 数学 AS score FROM grade1

union all

SELECT name, '英语' AS course, 英语 AS score FROM grade1

union all

SELECT name, '语文' AS course, 语文 AS score FROM grade1

)

order by name;

四、小结

行列互转在一些数据库使用场景中经常用到,比如数据分析、数仓建设等。但不同的数据库软件有着不同处理方式,但是行列换的基本思路是一致的。本文主要是以GaussDB数据为平台,为大家做了简单的讲述 ,欢迎测试。

点击关注,第一时间了解华为云新鲜技术~

相关推荐
苏生Susheng6 个月前
【Oracle】Oracle中的行转列、列转行(unpivot、pivot函数)
java·数据库·sql·oracle·列转行·行转列·sql函数
华为云开发者联盟8 个月前
LLVM技术在GaussDB等数据库中的应用
llvm·华为云gaussdb·华为云开发者联盟
华为云开发者联盟8 个月前
全球厂商之最,华为17篇论文入选国际数据库顶会ICDE
数据库·华为云gaussdb·华为云开发者联盟·华为云geminidb·icde
华为云开发者联盟8 个月前
GaussDB细粒度资源管控技术透视
资源隔离·华为云gaussdb·华为云开发者联盟·资源管控
华为云开发者联盟9 个月前
GaussDB SQL查询语句执行过程解析
华为云gaussdb·华为云开发者联盟·sql查询语句
华为云开发者联盟10 个月前
GaussDB(分布式)实例故障处理
华为云gaussdb·华为云开发者联盟
华为云开发者联盟1 年前
手把手带你认识GaussDB轻量化运维管理工具
华为云gaussdb·华为云开发者联盟·运维管理·容灾管理·监控警告
XueminXu1 年前
Hive数据仓库行转列
hive·struct·行转列·str_to_map·collect_list
华为云开发者联盟1 年前
对话苏光牛:国内数据库市场已进入关键转折点,2024年或是分水岭
华为云gaussdb·华为云开发者联盟
Data_IT_Farmer1 年前
Hive collect_set()、collect_list()列转行,并对转换后的行值排序
数据仓库·hive·行转列·行转列的值排序·sort_array