如何使用HiveSQL实现2个字符串间的映射及排序

这里写自定义目录标题

有2个表,1个表user_class存在2个字段:class,codes,另一个表user_info有2个字段:code,name。
期望返回每个class的codes及names,codes按照正序排序,names和codes顺序保持一致?

sql 复制代码
with user_class as (
  select 'A' as class,'2\|1\|3' as codes
  union all 
  select 'B' as class,'2\|1' as codes
),
user_info as (
  select '1' as code,'TOM' as name
  union all
  select '2' as code,'Jim' as name
  union all
  select '3' as code,'An' as name
)
select w.class,regexp_replace(w.code,'[0-9]+_','') code,regexp_replace(w.name,'[0-9]+_','') name from (
select r.class,concat_ws(',',sort_array(collect_list(r.code))) code,concat_ws(',',sort_array(collect_list(r.name))) name
from (
select s.class,concat(lpad(s.rnt,4,'0'),'_',s.code) code,concat(lpad(s.rnt,4,'0'),'_',s.name) name
from (
select t1.class,t1.code,t2.name,row_number() over(partition by t1.class order by t1.code) rnt from (
select
  t.class,s.code
from user_class t 
lateral view posexplode(split(codes,'\\|')) s as pos,code
) t1
left join
(select code,name
from user_info) t2
on t1.code = t2.code
) s
) r group by r.class
) w

实现结果如下:

相关推荐
MyikJ1 小时前
Java面试:从Spring Boot到分布式系统的技术探讨
java·大数据·spring boot·面试·分布式系统
猎板PCB 邹亮5 小时前
国内高频混压PCB厂家有哪些?
大数据·人工智能·pcb工艺
Microsoft Word7 小时前
Flink
大数据·flink
理***所7 小时前
湖北理元理律师事务所债务优化方案:让还款与生活平衡的艺术
大数据
TTBIGDATA12 小时前
Step9—Ambari Web UI 初始化安装 (Ambari3.0.0)
大数据·hadoop·python·ambari·bigtop·ttbigdata·janettr
冰橙子id12 小时前
基于ubuntu安装hadoop
大数据·hadoop·ubuntu
爱吃糖的靓仔13 小时前
ElasticSearch查询指定时间内出现的次数/2秒内出现的次数
大数据·elasticsearch·jenkins
鸿乃江边鸟13 小时前
Starrocks 物化视图的实现以及在刷新期间能否读数据
java·大数据·starrocks·sql
线条114 小时前
【Hive 运维实战】一键管理 Hive 服务:Metastore 与 HiveServer2 控制脚本开发与实践
hive·hadoop·自动化
Python数据分析与机器学习14 小时前
【python实战】二手房房价数据分析与预测
大数据·开发语言·python·数据挖掘·数据分析·scikit-learn·ipython