Hive进阶函数:SPACE() 一行炸裂指定行

数据一行如何转多行

假如有一张表,字段有两个,分别是name 和 number,代表含义为名字 和 名字出现的次数,现在需要把一行数据转为number行

举例:

输入:

复制代码
        tom|3

        jery|4

输出:

复制代码
      tom

      tom

      tom

      jery

      jery

      jery

      jery
思路分析:

把一行数据炸成对应的number行,类似于列传行,列传行常用的函数为explode,但是要传入一个数组,函数会根据数组把列变为行,所以现在如果有一个数组,里面分别有number元素就可以实现上述的例子

引入函数

space函数:space函数需要传入一个数值n,则会生成n个数组

sql 复制代码
输入:
    space(3)
输出
    '   '  -- 三个空格

那么生成number个空格,再按照空格切割

sql 复制代码
输入:
    split(space(3), ' ')
输出:
    '"","","",""'

注意 :因为切割时候一个空格会切割为左右两个空串,所以在生成空格时,仅需要number-1个即可

实现:

在理清思路和了解方法后,就可以实现了,按照上面的例子

sql 复制代码
select 
    name
from tbl
lateral view exploed(split(space(number-1), ' ') tmp as num

全部代码

sql 复制代码
with base as (
  select 'tom' as name, 3 as number
  union all 
  select 'jery' as name, 4 as number 
)

select 
  name
from base 
lateral view explode(split(space(number - 1), ' ')) tmp as num 

结果

sql 复制代码
name
tom
tom
tom
jery
jery
jery
jery
相关推荐
还是大剑师兰特4 小时前
Hadoop面试题及详细答案 110题 (86-95)-- Hadoop生态系统工具
hadoop·大剑师·hadoop面试题
yumgpkpm4 小时前
CMP (类Cloudera) CDP7.3(400次编译)在华为鲲鹏Aarch64(ARM)信创环境中的性能测试过程及命令
大数据·hive·hadoop·python·elasticsearch·spark·cloudera
Q26433650235 小时前
大数据实战项目-基于K-Means算法与Spark的豆瓣读书数据分析与可视化系统-基于python的豆瓣读书数据分析与可视化大屏
大数据·hadoop·机器学习·数据分析·spark·毕业设计·kmeans
大数据CLUB6 小时前
基于spark的抖音短视频数据分析及可视化
大数据·hadoop·分布式·数据分析·spark
yumgpkpm6 小时前
大数据综合管理平台(CMP)(类Cloudera CDP7.3)有哪些核心功能?
hive·hadoop·elasticsearch·zookeeper·big data
板凳坐着晒太阳7 小时前
Hive 删除分区语句卡死问题
数据仓库·hive·hadoop
Q264336502319 小时前
【有源码】基于Hadoop生态的大数据共享单车数据分析与可视化平台-基于Python与大数据的共享单车多维度数据分析可视化系统
大数据·hadoop·python·机器学习·数据分析·spark·毕业设计
计算机毕业设计木哥20 小时前
计算机毕设选题推荐:基于Hadoop和Python的游戏销售大数据可视化分析系统
大数据·开发语言·hadoop·python·信息可视化·spark·课程设计
嘉禾望岗5031 天前
hive on tez运行及hive ha搭建
数据仓库·hive·hadoop
RestCloud1 天前
PostgreSQL的数据集成之路:ETL+CDC实现实时多源聚合
数据库·数据仓库·postgresql·etl·数据处理·数据传输·数据同步