Hive进阶函数:SPACE() 一行炸裂指定行

数据一行如何转多行

假如有一张表,字段有两个,分别是name 和 number,代表含义为名字 和 名字出现的次数,现在需要把一行数据转为number行

举例:

输入:

复制代码
        tom|3

        jery|4

输出:

复制代码
      tom

      tom

      tom

      jery

      jery

      jery

      jery
思路分析:

把一行数据炸成对应的number行,类似于列传行,列传行常用的函数为explode,但是要传入一个数组,函数会根据数组把列变为行,所以现在如果有一个数组,里面分别有number元素就可以实现上述的例子

引入函数

space函数:space函数需要传入一个数值n,则会生成n个数组

sql 复制代码
输入:
    space(3)
输出
    '   '  -- 三个空格

那么生成number个空格,再按照空格切割

sql 复制代码
输入:
    split(space(3), ' ')
输出:
    '"","","",""'

注意 :因为切割时候一个空格会切割为左右两个空串,所以在生成空格时,仅需要number-1个即可

实现:

在理清思路和了解方法后,就可以实现了,按照上面的例子

sql 复制代码
select 
    name
from tbl
lateral view exploed(split(space(number-1), ' ') tmp as num

全部代码

sql 复制代码
with base as (
  select 'tom' as name, 3 as number
  union all 
  select 'jery' as name, 4 as number 
)

select 
  name
from base 
lateral view explode(split(space(number - 1), ' ')) tmp as num 

结果

sql 复制代码
name
tom
tom
tom
jery
jery
jery
jery
相关推荐
isfox17 小时前
Google GFS 深度解析:分布式文件系统的开山之作
大数据·hadoop
鼠鼠我捏,要死了捏19 小时前
Hadoop NameNode内存泄漏与GC停顿问题排查与解决方案
hadoop·问题排查·jvm优化
嘉禾望岗5031 天前
Yarn介绍与HA搭建
大数据·hadoop·yarn
IT研究室1 天前
大数据毕业设计选题推荐-基于大数据的国家药品采集药品数据可视化分析系统-Spark-Hadoop-Bigdata
大数据·hadoop·信息可视化·spark·毕业设计·数据可视化·bigdata
Lx3521 天前
Hadoop性能瓶颈分析:从JVM到磁盘IO的全链路优化
大数据·hadoop
DashingGuy1 天前
数仓建模理论
数据仓库
BYSJMG1 天前
计算机毕业设计选题:基于Spark+Hadoop的健康饮食营养数据分析系统【源码+文档+调试】
大数据·vue.js·hadoop·分布式·spark·django·课程设计
励志成为糕手1 天前
Hadoop进程:深入理解分布式计算引擎的核心机制
大数据·hadoop·分布式·mapreduce·yarn
像豆芽一样优秀1 天前
Hive和Flink数据倾斜问题
大数据·数据仓库·hive·hadoop·flink
计算机毕业设计木哥1 天前
计算机毕业设计 基于Python+Django的医疗数据分析系统
开发语言·hadoop·后端·python·spark·django·课程设计