正则表达式中常见的贪婪词

1. *

  • 含义:匹配前面的元素零次或者多次。
  • 示例 :对于正则表达式 a*,在字符串 "aaaa" 中,它会匹配整个 "aaaa",因为它会尽可能多地匹配 a 字符。
  • 代码示例(Python)
python 复制代码
import re
text = "aaaa"
pattern = re.compile(r'a*')
result = pattern.search(text)
print(result.group())  # 输出: aaaa

2. +

  • 含义:匹配前面的元素一次或者多次。
  • 示例 :正则表达式 a+ 在字符串 "aaaa" 中,同样会匹配整个 "aaaa",不过它至少要匹配一次 a 字符。
  • 代码示例(Python)
python 复制代码
import re
text = "aaaa"
pattern = re.compile(r'a+')
result = pattern.search(text)
print(result.group())  # 输出: aaaa

3. ?

  • 含义:匹配前面的元素零次或者一次。
  • 示例 :正则表达式 colou?r 可以匹配 "color""colour"u? 表示 u 这个字符可以出现零次或者一次。
  • 代码示例(Python)
python 复制代码
import re
text1 = "color"
text2 = "colour"
pattern = re.compile(r'colou?r')
result1 = pattern.search(text1)
result2 = pattern.search(text2)
print(result1.group())  # 输出: color
print(result2.group())  # 输出: colour

4. {n,}

  • 含义 :匹配前面的元素至少 n 次。
  • 示例 :正则表达式 a{2,} 在字符串 "aaaa" 中,会匹配整个 "aaaa",因为它要求 a 至少出现 2 次。
  • 代码示例(Python)
python 复制代码
import re
text = "aaaa"
pattern = re.compile(r'a{2,}')
result = pattern.search(text)
print(result.group())  # 输出: aaaa

5. {n,m}

  • 含义 :匹配前面的元素至少 n 次,但不超过 m 次。
  • 示例 :正则表达式 a{2,3} 在字符串 "aaaa" 中,会匹配前三个 a,即 "aaa",因为它尽量在 2 到 3 次的范围内进行最大匹配。
  • 代码示例(Python)
python 复制代码
import re
text = "aaaa"
pattern = re.compile(r'a{2,3}')
result = pattern.search(text)
print(result.group())  # 输出: aaa

贪婪字符会尽可能多地去匹配符合条件的字符,直到无法再匹配为止,因此会导致回溯问题,因此在实际应用中,应该避免使用贪婪字符。

如果想让贪婪字符变为非贪婪模式,只需在其后加上 ? 即可,如:*?+???{n,}?{n,m}?,

此模式将会尽可能少的去匹配字符,但是可能无法达到预期结果,大家酌情选择。

相关推荐
不知几秋42 分钟前
数字取证-内存取证(volatility)
java·linux·前端
珊珊而川2 小时前
ChatPromptTemplate创建方式比较
服务器·langchain
chxii4 小时前
5java集合框架
java·开发语言
欧先生^_^4 小时前
Linux内核可配置的参数
linux·服务器·数据库
若风的雨4 小时前
【deekseek】P2P通信路由过程
服务器·网络协议·p2p
Python私教4 小时前
征服Rust:从零到独立开发的实战进阶
服务器·开发语言·rust
yychen_java4 小时前
R-tree详解
java·算法·r-tree
JANYI20185 小时前
嵌入式设计模式基础--C语言的继承封装与多态
java·c语言·设计模式
xrkhy5 小时前
反射, 注解, 动态代理
java
Ten peaches5 小时前
Selenium-Java版(操作元素)
java·selenium·测试工具·html