oracle中基于正则表达式匹配规则提取子串的函数REGEXP_SUBSTR

REGEXP_SUBSTR 函数 ------ 复杂 / 动态结构字符串的解决方案

适用场景:

不知道子串的固定位置,但知道子串的内容格式(如数字、邮箱、特定分隔符分割的内容);

字符串结构不固定(如混合文字 + 数字、分隔符位置不固定等),SUBSTR 无法直接实现。

示例:

sql 复制代码
-- 示例1:提取字符串中第一个数字串(位置不固定,SUBSTR无法直接实现)
SELECT REGEXP_SUBSTR('订单号:ORD20240109,金额:999元', '\d+') AS result FROM DUAL;
-- 输出:20240109

-- 示例2:按分隔符提取第3个元素(分隔符位置不固定,SUBSTR需嵌套INSTR,步骤繁琐)
SELECT REGEXP_SUBSTR('苹果|香蕉|橙子|葡萄', '[^|]+', 1, 3) AS result FROM DUAL;
-- 输出:橙子

-- 示例3:提取邮箱中的域名(格式匹配,SUBSTR需先找@的位置,且适配性差)
SELECT REGEXP_SUBSTR('test_123@oracle.com', '@(.+)', 1, 1, 'c', 1) AS 域名 FROM DUAL;
-- 输出:oracle.com

-- 【对比】用SUBSTR实现示例3(步骤多,且若邮箱有异常格式则失效)
SELECT SUBSTR('test_123@oracle.com', INSTR('test_123@oracle.com', '@')+1) AS 域名 FROM DUAL;

对比 SUBSTR 函数而言,各自有不同的使用场景。

SUBSTR 函数:

明确知道要提取的子串在源字符串中的起始位置和长度;

字符串格式完全固定(如身份证号、固定长度的编码等)。

在实际开发中,遵循 "能用 SUBSTR 就不用 REGEXP_SUBSTR" 的原则:

若字符串结构固定(如固定长度编码、身份证号、手机号分段),优先用SUBSTR,性能更高、代码更简洁;

若字符串结构动态 / 不规则(如提取任意位置的数字、按分隔符提取第 N 个元素、匹配邮箱 / 手机号格式),再用REGEXP_SUBSTR。

总结

  1. SUBSTR是固定位置 / 长度的字符串截取工具,性能最优,适合结构固定的字符串;
  2. REGEXP_SUBSTR是复杂模式匹配工具,灵活性强,适合结构不固定、需按内容匹配的场景,但性能略低;
  3. 选型核心:先判断字符串结构是否固定,固定用SUBSTR,不固定用REGEXP_SUBSTR。
相关推荐
fengxin_rou几秒前
【MySQL SQL 执行全链路剖析】:执行计划、慢查询与经典场景优化指南
数据库·sql·mysql
在繁华处几秒前
从零搭建轻灵(五):记忆系统与生产化特性
java·jvm·oracle
betazhou2 分钟前
LOG_ARCHIVE_DEST_2 ORA-01033: ORACLE initialization or shut
数据库·oracle·oracle19c adg
思诺学长5 分钟前
MySQL——数据库并发控制策略: 乐观锁与悲观锁
数据库
fengxin_rou5 分钟前
【Spring AI 集成 DeepSeek 实现 AI 摘要与 RAG 问答】:从原理到落地实践
数据库·mysql·rag·deepseek
No8g攻城狮8 分钟前
【异常解决】SpringBoot3 + 人大金仓 V8+MyBatis-Plus 获取新增自增 ID
数据库·mybatis·人大金仓·国产信创
鱼听禅9 分钟前
CentOS搭建SVN服务器
数据库·postgresql·sqlserver
ylscode21 分钟前
微软Edge浏览器启动时停止将已保存的密码加载到内存中
网络·数据库·安全·安全威胁分析
电魂泡哥7 小时前
SQL出现filesort 一定慢吗
数据库·sql
muddjsv8 小时前
大中小型企业数据层配置规模分析与选型指南
数据库