正则表达式中常见的贪婪词

1. *

  • 含义:匹配前面的元素零次或者多次。
  • 示例 :对于正则表达式 a*,在字符串 "aaaa" 中,它会匹配整个 "aaaa",因为它会尽可能多地匹配 a 字符。
  • 代码示例(Python)
python 复制代码
import re
text = "aaaa"
pattern = re.compile(r'a*')
result = pattern.search(text)
print(result.group())  # 输出: aaaa

2. +

  • 含义:匹配前面的元素一次或者多次。
  • 示例 :正则表达式 a+ 在字符串 "aaaa" 中,同样会匹配整个 "aaaa",不过它至少要匹配一次 a 字符。
  • 代码示例(Python)
python 复制代码
import re
text = "aaaa"
pattern = re.compile(r'a+')
result = pattern.search(text)
print(result.group())  # 输出: aaaa

3. ?

  • 含义:匹配前面的元素零次或者一次。
  • 示例 :正则表达式 colou?r 可以匹配 "color""colour"u? 表示 u 这个字符可以出现零次或者一次。
  • 代码示例(Python)
python 复制代码
import re
text1 = "color"
text2 = "colour"
pattern = re.compile(r'colou?r')
result1 = pattern.search(text1)
result2 = pattern.search(text2)
print(result1.group())  # 输出: color
print(result2.group())  # 输出: colour

4. {n,}

  • 含义 :匹配前面的元素至少 n 次。
  • 示例 :正则表达式 a{2,} 在字符串 "aaaa" 中,会匹配整个 "aaaa",因为它要求 a 至少出现 2 次。
  • 代码示例(Python)
python 复制代码
import re
text = "aaaa"
pattern = re.compile(r'a{2,}')
result = pattern.search(text)
print(result.group())  # 输出: aaaa

5. {n,m}

  • 含义 :匹配前面的元素至少 n 次,但不超过 m 次。
  • 示例 :正则表达式 a{2,3} 在字符串 "aaaa" 中,会匹配前三个 a,即 "aaa",因为它尽量在 2 到 3 次的范围内进行最大匹配。
  • 代码示例(Python)
python 复制代码
import re
text = "aaaa"
pattern = re.compile(r'a{2,3}')
result = pattern.search(text)
print(result.group())  # 输出: aaa

贪婪字符会尽可能多地去匹配符合条件的字符,直到无法再匹配为止,因此会导致回溯问题,因此在实际应用中,应该避免使用贪婪字符。

如果想让贪婪字符变为非贪婪模式,只需在其后加上 ? 即可,如:*?+???{n,}?{n,m}?,

此模式将会尽可能少的去匹配字符,但是可能无法达到预期结果,大家酌情选择。

相关推荐
忆~遂愿3 分钟前
ops-cv 算子库深度解析:面向视觉任务的硬件优化与数据布局(NCHW/NHWC)策略
java·大数据·linux·人工智能
小韩学长yyds13 分钟前
Java序列化避坑指南:明确这4种场景,再也不盲目实现Serializable
java·序列化
仟濹14 分钟前
【Java基础】多态 | 打卡day2
java·开发语言
Re.不晚15 分钟前
JAVA进阶之路——无奖问答挑战2
java·开发语言
Fcy6481 小时前
Linux下 进程(一)(冯诺依曼体系、操作系统、进程基本概念与基本操作)
linux·运维·服务器·进程
袁袁袁袁满1 小时前
Linux怎么查看最新下载的文件
linux·运维·服务器
Ro Jace1 小时前
计算机专业基础教材
java·开发语言
mango_mangojuice1 小时前
Linux学习笔记(make/Makefile)1.23
java·linux·前端·笔记·学习
程序员侠客行1 小时前
Mybatis连接池实现及池化模式
java·后端·架构·mybatis
时艰.2 小时前
Java 并发编程 — 并发容器 + CPU 缓存 + Disruptor
java·开发语言·缓存