正则表达式原理

一、* 量词的核心定义与特性

* 是正则表达式中最灵活的量词之一,核心作用是修饰其紧邻的前一个元素,贪婪匹配 0 次或任意多次(无上限),关键特性如下:

  1. 匹配范围:0 次(无匹配)、1 次、2 次...... 直到字符串结束,无固定上限;
  2. 贪婪策略:优先匹配 "连续符合规则的最大长度",遇到不符合的字符则停止,不会跨字符匹配;
  3. 匹配本质 :仅针对 "连续且符合规则" 的字符段,而非字符串中所有符合规则的字符(比如 a* 匹配 "a1aa" 会分段匹配 "a""aa",而非一次性匹配 3 个 a);
  4. 0 次匹配≠失败 :即使无符合规则的字符,* 也会匹配空字符串(""),而非匹配失败。

二、* 的核心适用场景(唯一正确用法)

* 仅适用于「某段内容长度动态 且允许长度为 0」的场景,即内容 "可有可无、多少都行",典型场景:

  1. 可选前缀 / 后缀 :匹配可有可无的内容(如手机号可选的 +86 前缀:^(?:\+86)*\d{11}$);
  2. 任意长度的连续字符(含空) :提取 / 匹配长度不确定且允许无的字符(如提取数字前的所有字母:^[a-zA-Z]*);
  3. 兜底匹配空字符串 :验证 "允许为空" 的场景(如输入框可空或全数字:^\d*$);
  4. 万能模糊匹配 :配合通配符 . 实现 .*(匹配 0 个 / 任意个任意字符),用于模糊检索(如查找含关键词的字符串:.*关键词.*)。

三、* 的绝对避坑要点(禁止使用场景)

* 无法精准限制匹配次数,以下场景绝对不能用 *,否则会导致逻辑错误:

  1. 精准次数匹配 :如 "匹配 3 位数字",需用 \d{3},而非 \d*\d* 会匹配 1/2/4 位等任意数字);
  2. 至少 1 次匹配 :如 "验证非空数字",需用 \d+,而非 \d*\d* 会匹配空字符串);
  3. 限定次数范围 :如 "匹配 2-5 位数字",需用 \d{2,5},而非 \d*

四、* 与其他核心量词的对比(快速选型)

量词 匹配范围 核心特点 适用场景 典型示例
* 0 次~无限次 允许为空、长度无上限 内容可有可无、多少都行 \d*(任意数字 / 空)
+ 1 次~无限次 不允许为空、长度无上限 内容必须有、多少都行 \d+(非空数字)
? 0 次~1 次 允许为空、最多 1 次 内容可选且最多 1 个 \d?(0/1 个数字)
{n} 恰好 n 次 精准次数、不允许为空 内容长度固定 \d{3}(3 位数字)
{n,} 至少 n 次 不允许为空、长度无上限 内容至少 n 个、多少都行 \d{2,}(≥2 位数字)

五、核心口诀(快速记忆)

  1. * = 动态长度(0~∞),+ = 动态长度(1~∞);
  2. *:可有可无、多少都行;+:必须有、多少都行;{n}:必须有、固定个数;
  3. 看到 "允许为空" 用 *,看到 "必须有" 用 +,看到 "固定次数" 用 {n}

六、关键提醒

  1. * 仅修饰 "紧邻的前一个元素":如 ab*a + b** 只修饰 b),若需修饰多个字符,需用分组 (ab)*
  2. * 的贪婪性是 "连续最大长度":不要误以为 * 会匹配字符串中所有符合规则的字符,它只会匹配连续的一段;
  3. 结合锚点 ^/$ 使用:单独用 \d* 无意义,需配合 ^/$ 限定整个字符串(如 ^\d*$ 验证全数字 / 空)。
相关推荐
Yushan Bai20 分钟前
RAC环境数据文件读取异常导致实例重启
数据库·oracle
小猿姐22 分钟前
当KubeBlocks遇上国产数据库之Kingbase:让信创数据库“飞得更高”
运维·数据库·云原生
小李的便利店26 分钟前
系统架构设计师-案例分析-数据库系统设计
数据库·系统架构
似水এ᭄往昔28 分钟前
【Linux】--进程概念
linux·运维·服务器
IDIOT___IDIOT28 分钟前
Linux 使用 `cp` 命令导致挂载点被覆盖问题记录
linux·运维·服务器
洛菡夕35 分钟前
MySQL全量、增量备份与恢复
数据库·mysql
Sunia1 小时前
《Spring AI + 大模型全栈实战》学习手册系列 · 专题二:《Milvus 向量数据库:从零开始搭建 RAG 系统的核心组件》
数据库
RisunJan1 小时前
Linux命令-mount(用于挂载Linux系统外的文件)
linux·运维·服务器
絆人心1 小时前
最新 SQL 常用语句大全(新手入门 + 老手速查,含 DQL/DML/DDL)
数据库·sql·oracle
脆皮炸鸡7551 小时前
Linux开发工具~~~版本控制器Git以及调试工具GDB
linux·服务器·开发语言·经验分享·git·学习方法