如何使用HiveSQL实现2个字符串间的映射及排序

这里写自定义目录标题

有2个表,1个表user_class存在2个字段:class,codes,另一个表user_info有2个字段:code,name。
期望返回每个class的codes及names,codes按照正序排序,names和codes顺序保持一致?

sql 复制代码
with user_class as (
  select 'A' as class,'2\|1\|3' as codes
  union all 
  select 'B' as class,'2\|1' as codes
),
user_info as (
  select '1' as code,'TOM' as name
  union all
  select '2' as code,'Jim' as name
  union all
  select '3' as code,'An' as name
)
select w.class,regexp_replace(w.code,'[0-9]+_','') code,regexp_replace(w.name,'[0-9]+_','') name from (
select r.class,concat_ws(',',sort_array(collect_list(r.code))) code,concat_ws(',',sort_array(collect_list(r.name))) name
from (
select s.class,concat(lpad(s.rnt,4,'0'),'_',s.code) code,concat(lpad(s.rnt,4,'0'),'_',s.name) name
from (
select t1.class,t1.code,t2.name,row_number() over(partition by t1.class order by t1.code) rnt from (
select
  t.class,s.code
from user_class t 
lateral view posexplode(split(codes,'\\|')) s as pos,code
) t1
left join
(select code,name
from user_info) t2
on t1.code = t2.code
) s
) r group by r.class
) w

实现结果如下:

相关推荐
GeminiJM2 小时前
Elasticsearch混合搜索深度解析(上):问题发现与源码探索
大数据·elasticsearch·jenkins
桂成林4 小时前
基于Flink 1.20、StarRocks与TiCDC构建高效数据处理链路教程
大数据·flink
Leo.yuan4 小时前
数据清洗(ETL/ELT)原理与工具选择指南:企业数字化转型的核心引擎
大数据·数据仓库·数据挖掘·数据分析·etl
UI前端开发工作室5 小时前
数字孪生技术为UI前端提供新视角:产品性能的实时模拟与预测
大数据·前端
bxlj_jcj6 小时前
Flink DataStream API详解(二)
大数据·flink
涛思数据(TDengine)7 小时前
时序数据库 TDengine × SSRS:专为工业、能源场景打造的报表解决方案
大数据·数据库·物联网·时序数据库·tdengine
isNotNullX7 小时前
实时数仓和离线数仓还分不清楚?看完就懂了
大数据·数据库·数据仓库·人工智能·数据分析
潮湿的心情7 小时前
亚洲牧原:活跃行业交流,延伸公益版图,市场拓展再结硕果
大数据·人工智能
落雪小轩韩7 小时前
Git 常用操作与注意事项全攻略
大数据·git
winds~7 小时前
【Git】git的回退功能
大数据·git·elasticsearch