如何使用HiveSQL实现2个字符串间的映射及排序

这里写自定义目录标题

有2个表,1个表user_class存在2个字段:class,codes,另一个表user_info有2个字段:code,name。
期望返回每个class的codes及names,codes按照正序排序,names和codes顺序保持一致?

sql 复制代码
with user_class as (
  select 'A' as class,'2\|1\|3' as codes
  union all 
  select 'B' as class,'2\|1' as codes
),
user_info as (
  select '1' as code,'TOM' as name
  union all
  select '2' as code,'Jim' as name
  union all
  select '3' as code,'An' as name
)
select w.class,regexp_replace(w.code,'[0-9]+_','') code,regexp_replace(w.name,'[0-9]+_','') name from (
select r.class,concat_ws(',',sort_array(collect_list(r.code))) code,concat_ws(',',sort_array(collect_list(r.name))) name
from (
select s.class,concat(lpad(s.rnt,4,'0'),'_',s.code) code,concat(lpad(s.rnt,4,'0'),'_',s.name) name
from (
select t1.class,t1.code,t2.name,row_number() over(partition by t1.class order by t1.code) rnt from (
select
  t.class,s.code
from user_class t 
lateral view posexplode(split(codes,'\\|')) s as pos,code
) t1
left join
(select code,name
from user_info) t2
on t1.code = t2.code
) s
) r group by r.class
) w

实现结果如下:

相关推荐
卖寂寞的小男孩1 小时前
spark数据缓存机制
大数据·缓存·spark
jiedaodezhuti2 小时前
Flink直接缓冲存储器异常解析与解决方案
大数据·flink
代码的余温3 小时前
Elasticsearch Master选举机制解析
大数据·elasticsearch·搜索引擎
计算机源码社3 小时前
计算机毕设选题推荐 基于Spark的家庭能源消耗智能分析与可视化系统 基于机器学习的家庭能源消耗预测与可视化系统源码
大数据·机器学习·数据分析·spark·毕业设计·课程设计·毕业设计源码
IT研究室4 小时前
大数据毕业设计选题推荐-基于大数据的北京市医保药品数据分析系统-Spark-Hadoop-Bigdata
大数据·hadoop·spark·毕业设计·源码·数据可视化
Flink_China4 小时前
Lazada 如何用实时计算 Flink + Hologres 构建实时商品选品平台
大数据·flink
时序数据说6 小时前
IoTDB如何解决海量数据存储难题?
大数据·数据库·物联网·时序数据库·iotdb
ManageEngineITSM6 小时前
云原生环境下的ITSM新趋势:从传统运维到智能化服务管理
大数据·运维·人工智能·云原生·itsm·工单系统
As33100106 小时前
Manus AI 与多语言手写识别技术全解析
大数据·网络·人工智能
我要学习别拦我~7 小时前
Kaggle项目:一次 Uber 出行数据分析的完整思路
大数据·经验分享·数据分析