
区别在于是否加?,同理在{}中也是如此
贪婪模式
{m,n}
- 对其之前的正则表达式进行 m 到 n 次匹配,在 m 和 n 之间取尽量多(贪婪方式)
- 忽略 m 则下限默认为 0,忽略 n 则上限默认为无限次(逗号不能省 略)
python
import re
p = re.compile(r"ab{2,4}")
print(p.search("abc")) #None
print(p.search("abbc")) #<re.Match object; span=(0, 3), match='abb'>
print(p.search("abbbc")) #<re.Match object; span=(0, 4), match='abbb'>
print(p.search("abbbbc")) #<re.Match object; span=(0, 5), match='abbbb'>
print(p.search("abbbbbc")) #<re.Match object; span=(0, 5), match='abbbb'>
p = re.compile(r"ab{,4}")
print(p.search("ac")) #<re.Match object; span=(0, 1), match='a'>
print(p.search("abc")) #<re.Match object; span=(0, 2), match='ab'>
p = re.compile(r"ab{2,}")
print(p.search("abbbbc")) #<re.Match object; span=(0, 5), match='abbbb'>
print(p.search("abbbbbc")) #<re.Match object; span=(0, 6), match='abbbbb'>
非贪婪模式
*? +? ??
- " * + ? "都是贪婪的,它们对字符串进行尽可能多的匹配,有时候并不需要这种行为,可以在之后添加?,就可以以非贪婪的方式进行匹配,则尽可能少的字符将会被匹配
python
import re
p = re.compile(r'<.*>')
print(p.search('<a> b <c>')) #<re.Match object; span=(0, 9), match='<a> b <c>'>
p = re.compile(r'<.*?>')
print(p.search('<a> b <c>')) #<re.Match object; span=(0, 3), match='<a>'>
p = re.compile(r"ab+?")
print(p.search("abbbc")) #<re.Match object; span=(0, 2), match='ab'>
p = re.compile(r"ab??")
print(p.search("abc")) #<re.Match object; span=(0, 1), match='a'>
{m,n}?
- {m,n} 的非贪婪模式
python
import re
p = re.compile(r"ab{2,4}?")
print(p.search("abc")) #None
print(p.search("abbc")) #<re.Match object; span=(0, 3), match='abb'>
print(p.search("abbbc")) #<re.Match object; span=(0, 3), match='abb'>
print(p.search("abbbbc")) #<re.Match object; span=(0, 3), match='abb'>
print(p.search("abbbbbc")) #<re.Match object; span=(0, 3), match='abb'>