SQL,从每组中的 json 字段中提取唯一值

postgreySQL 库表的第 1 列是 ID,用于排序;第 2 列是分类;第 3 列类似 json(非标准 json), 并存在重复项。

|----|----------------|---------------------------------------------------------------------|
| id | component_type | component_names |
| 1 | INGESTION | {ingestiona,atul, ingestiona, ingestionb} |
| 2 | INGESTION | {test_s3_prerit, atul} |
| 3 | DQM | {testmigration} |
| 4 | SCRIPT | {scripta,scripta,scripta,testimportscript,testimportscript,b,c,c,x} |
| 5 | SCRIPT | {testimportscript, scripta,scripta,a,a,b,b,c} |
| 6 | SCRIPT | {Script_Python,scripta,x} |
| 7 | BUSINESS_RULES | {s3_testH_Graph} |
| 8 | EXPORT | {Export2} |

要求:用 Java 提取每组的唯一值,并使其位于原记录的原位置;或者说,按照原分组每条记录的顺序,自上而下依次删掉重复的项,唯一值保持原位。

|----------------|----------------------------------|
| component_type | component_names |
| INGESTION | {ingestiona,atul,ingestionb} |
| INGESTION | {test_s3_prerit} |
| DQM | {testmigration} |
| SCRIPT | {scripta,testimportscript,b,c,x} |
| SCRIPT | {a} |
| SCRIPT | {Script_Python} |
| BUSINESS_RULES | {s3_testH_Graph} |
| EXPORT | {Export2} |

编写SPL代码

|---|--------------------------------------------------------------------------------|
| | A  |
| 1 | =post1.query("select component_type,component_names from tb order by id") |
| 2 | =A1.run(#2=mid(#2,2,len(#2)-2).split@tc() ) |
| 3 | =A2.group@u(#1).(~.run( #2=(#2[-1]|#2).id@u() ).rvs().run(#2=#2\#2[1])) |
| 4 | return A1.run(#2="{"+#2.concat@c()+"}") |

A1:通过JDBC查询数据库。

A2:将每条记录的第 2 个字段拆分为多项。

A3:按第 1 列分组并保持原序,然后处理每组数据:按记录顺序累积各项,并去除重复;颠倒记录顺序;用本记录的累积结果和下条记录的累积结果求差集。

A4:恢复原字符串格式,并返回结果。

Java 集成 SPL 可参考 Java 如何调用 SPL 脚本

SPL开源地址

相关推荐
杨超越luckly1 分钟前
从传统 GIS 向智能/自动化脚本演进:地铁接驳公交识别的 ArcGIS 与 Python 双路径实践
开发语言·arcgis·php·交互·数据可视化
qw9493 分钟前
Python语言概述
开发语言·python
TDengine (老段)3 分钟前
TDengine TSDB 产品常见问题解决指南
大数据·数据库·物联网·时序数据库·tdengine·涛思数据
毕设源码-邱学长5 分钟前
【开题答辩全过程】以 基于Python的茶叶销售数据可视化分析系统设计实现为例,包含答辩的问题和答案
开发语言·python·信息可视化
人道领域6 分钟前
SSM从入门到入土(Spring Bean实例化与依赖注入全解析)
java·开发语言·spring boot·后端
Dxy12393102167 分钟前
MySQL如何排序后取最后10条数据——性能优化全解析
数据库·mysql·性能优化
Aloudata11 分钟前
高并发指标中台选型:Aloudata CAN 横向扩展与架构稳定性深度评估
数据库·架构·数据分析·etl·指标平台
Mr_star_galaxy11 分钟前
【MySQL】数据库基础
数据库·mysql
毕设源码-赖学姐12 分钟前
【开题答辩全过程】以 基于Java web的宠物领养系统的设计与实现为例,包含答辩的问题和答案
java·开发语言·宠物
m0_7066532312 分钟前
Python深度学习入门:TensorFlow 2.0/Keras实战
jvm·数据库·python