在数据处理与查询场景中,SQL 正则表达式是实现模糊匹配、数据清洗、格式校验的核心工具,相比传统 LIKE 模糊查询,正则表达式支持更复杂的字符规则匹配,能高效解决手机号、邮箱、身份证号等格式验证、关键词精准提取等需求。
本文将以MySQL为主(兼容主流数据库正则语法),系统讲解SQL正则表达式的语法规则、常用函数、实战案例,并搭配表格总结与可直接运行的代码示例,帮你快速掌握SQL正则的使用技巧。
一、SQL正则表达式基础认知
SQL中的正则表达式依赖数据库内置函数实现,MySQL使用 REGEXP / RLIKE 关键字+正则语法完成匹配,Oracle使用 REGEXP_LIKE 函数,核心语法逻辑一致,仅函数调用形式略有差异。
核心作用
- 精准匹配符合特定规则的字符串(如纯数字、邮箱格式)
- 替代 LIKE 实现复杂模糊查询(如匹配以某字符开头、包含指定字符组)
- 数据清洗:过滤无效数据、提取规范格式内容
二、SQL正则表达式核心语法(速查表)
以下是MySQL正则表达式最常用的元字符与语法,覆盖90%实战场景,建议直接收藏:
元字符/符号 含义说明 匹配示例
^ 匹配字符串开头 ^a :以a开头的字符串
匹配字符串结尾 s :以s结尾的字符串
. 匹配任意单个字符(除换行) a.c :abc、a1c、a@c
- 匹配前面的字符0次或多次 ab* :a、ab、abb
- 匹配前面的字符1次或多次 ab+ :ab、abb、abbb
? 匹配前面的字符0次或1次 ab? :a、ab字符集\] 匹配字符集中任意一个字符 \[abc\] :a、b、c; \[0-9\] :任意数字 \[\^字符集\] 匹配不在字符集中的字符 \[\^0-9\] :非数字字符 {n} 匹配前面的字符恰好n次 \[0-9\]{3} :3位数字 {n,m} 匹配前面的字符n\~m次 \[0-9\]{2,4} :2-4位数字 ` ` 逻辑或匹配 () 分组,将多个字符作为整体匹配 (ab)+ :ab、abab
三、SQL正则常用函数与基础用法
- MySQL:REGEXP/RLIKE 关键字
MySQL中直接使用 字段名 REGEXP '正则表达式' 即可实现匹配, RLIKE 是 REGEXP 的同义词,效果完全一致。
语法格式:
sql
SELECT 字段 FROM 表名 WHERE 字段 REGEXP '正则规则';
- 基础匹配代码示例
示例1:匹配以指定字符开头/结尾的数据
sql
-- 匹配用户名以字母a开头的用户
SELECT username FROM user WHERE username REGEXP '^a';
-- 匹配手机号以88结尾的用户
SELECT phone FROM user WHERE phone REGEXP '88$';
示例2:匹配包含指定字符组的数据
sql
-- 匹配用户名包含a/b/c中任意一个字符的记录
SELECT username FROM user WHERE username REGEXP '[abc]';
-- 匹配用户名纯数字的记录
SELECT username FROM user WHERE username REGEXP '[1](#1)+$';
示例3:匹配固定长度/范围长度的字符
sql
-- 匹配手机号为11位纯数字(基础校验)
SELECT phone FROM user WHERE phone REGEXP '[2](#2){11}$';
-- 匹配密码长度6-12位,包含字母/数字
SELECT password FROM user WHERE password REGEXP '[3](#3){6,12}$';
四、SQL正则实战高级案例
案例1:邮箱格式校验
匹配标准邮箱格式(字符@域名.后缀):
sql
-- 校验邮箱是否符合 xxx@xxx.xxx 格式
SELECT email FROM user
WHERE email REGEXP '[4](#4)+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,6}$';
规则解析:
- [5](#5)+ :邮箱前缀由字母、数字、下划线、点、横杠组成
- @ :固定@符号
-
a-zA-Z0-9.-\]+ :域名主体
案例2:身份证号校验(18位)
sql
-- 匹配18位身份证号(最后一位可为X/x)
SELECT id_card FROM user
WHERE id_card REGEXP '[6](#6)\d{5}[1-9]\d{3}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}([0-9]|X|x)$';
案例3:过滤含特殊字符的用户名
sql
-- 匹配用户名包含@#$%等特殊字符的记录
SELECT username FROM user WHERE username REGEXP '[^a-zA-Z0-9]';
案例4:逻辑或匹配多关键词
sql
-- 匹配地址包含北京、上海、广州的记录
SELECT address FROM user WHERE address REGEXP '北京|上海|广州';
五、不同数据库正则差异(极简总结)
数据库 正则函数/关键字 核心区别
MySQL REGEXP / RLIKE 语法简洁,不区分大小写,支持基础正则
Oracle REGEXP_LIKE 函数式调用,支持更丰富的正则扩展
SQL Server LIKE +通配符/ PATINDEX 2017+支持 REGEXP ,兼容部分语法
六、注意事项
- 转义字符:匹配 . 、 * 、 + 等元字符本身时,需加 \ 转义(如 \. 匹配点号)
- 性能优化:正则匹配会全表扫描,大数据量下建议先过滤索引字段,再用正则
- 大小写区分:MySQL默认不区分,需区分时用 REGEXP BINARY
七、总结
SQL正则表达式是数据查询的高效利器,相比传统 LIKE 查询,灵活性提升数倍,尤其适合数据格式校验、复杂模糊匹配场景。
本文整理的正则语法表可直接作为速查手册,搭配实战代码示例,能快速解决日常开发中的字符串匹配问题。建议在实际业务中,优先使用正则完成格式验证类需求。