字符串分割并展开成表格的SQL实现方法

一、场景案例

在数据开发类项目中,常常会遇到需要将字符串进行切割并展开成表格的场景,如以下两种常见的案例:

1.标签类型数据:如将员工标签类型的数据

复制代码
- 技能:Java、Spring、微服务、项目管理
- 项目经验:电商、金融、教育
- 工作风格:#执行力强 #跨部门协作 #数据驱动

2.分类层级数据:如将组织部门层级数据:"/集团/分公司/信息技术部/数据团队"

除此之外,在一些特定的业务场景中,如证券场景中,需要将一笔回购合约涉及到的多个质押券进行拆分(提取每个质押券有质押数量及对应标准券转换比例),数据示例如下:

另外,API请求的返回的数据多为半结构化的字典列表数据,需要将每行数据从列表中进行提取出来再进行后续的处理,如以下数据:

复制代码
{"data": [   {"AMOUNT":-9000,"SUB_TYPE_NAME":"债券分销","BRANCH_NAME":"银行间","TYPE_NAME":"收入","BUSI_DATE":"20250831","PROJECT_NAME":"调整1月分销佣金-24****MTN001"},
    {"AMOUNT":-1075.61,"SUB_TYPE_NAME":"债券分销","BRANCH_NAME":"银行间","TYPE_NAME":"收入","BUSI_DATE":"20250531","PROJECT_NAME":"调整计提1月及3月分销佣金"}
    ],
"success":true
}

二,各类主流SQL方言实现方法

针对这类场景,目前没有标准SQL函数支持实现该功能。各类SQL方言通过自定义方法进行支持,以下是常用的实现方法。

Spark/Hive SQL

采用split + explode(及升级版posexplode)。以下为测试案例:

利用该方法可以轻松的回购质押券进行拆分处理:

PostgreSQL

有两种方法:

方法一:首先利用string_to_array将字符串切割成数组,然后利用unnest将数组扩展成表

方法二:直接利用regexp_split_to_table将字符串切割并转换成表

Oracle

利用connect by + Level来实现

MySQL

5.x+版本只能使用数字辅助表+SUBSTRING_INDEX。

复制代码
SELECT 
    o.order_id,
    j.product_id
FROM orders o
JOIN JSON_TABLE(
    CONCAT('["', REPLACE(o.product_ids, ',', '","'), '"]'),
    '$[*]' COLUMNS (product_id INT PATH '$')
) AS j;

SQL Server

早期版本无内置函数,只能通过自定义表值函数(TVF)或者XML方法

2016之后的版本可使用原生方法STRING_SPLIT

复制代码
--带序号的版本(SQL Server 2022+)
SELECT value, ordinal
FROM STRING_SPLIT('a,b,c', ',', 1) -- 第三个参数启用序号

三、结论

Spark SQL、PostgreSQL最方便,思路也比较相似,都是先将字符串拆分数组,然后扩展成表。SQLServer新版本实现较为方法,直接一个函数搞定。Oracle利用其connect by来实现,也相对便捷,只是相对主流SQL方言比较小众一点。Mysql新版本相对方便一点,老版本需要辅助表增加维护成本。

文章转载自: ++大汪的数据之路++

原文链接: https://www.cnblogs.com/davablog/p/19497701

体验地址: http://www.jnpfsoft.com/?from=001YH

相关推荐
杨超越luckly8 小时前
HTML应用指南:利用GET请求获取中国500强企业名单,揭秘企业增长、分化与转型的新常态
前端·数据库·html·可视化·中国500强
Elastic 中国社区官方博客8 小时前
Elasticsearch:Workflows 介绍 - 9.3
大数据·数据库·人工智能·elasticsearch·ai·全文检索
仍然.8 小时前
MYSQL--- 聚合查询,分组查询和联合查询
数据库
一 乐8 小时前
校园二手交易|基于springboot + vue校园二手交易系统(源码+数据库+文档)
java·数据库·vue.js·spring boot·后端
啦啦啦_99998 小时前
Redis-0-业务逻辑
数据库·redis·缓存
证榜样呀8 小时前
2026 中专大数据技术专业可考的证书有哪些,必看!
大数据·sql
Codefengfeng8 小时前
数据安全知识点速通
sql
自不量力的A同学9 小时前
Redisson 4.2.0 发布,官方推荐的 Redis 客户端
数据库·redis·缓存
Exquisite.9 小时前
Mysql
数据库·mysql
全栈前端老曹9 小时前
【MongoDB】深入研究副本集与高可用性——Replica Set 架构、故障转移、读写分离
前端·javascript·数据库·mongodb·架构·nosql·副本集