正则表达式

正则表达式

import re

限定符(quantifier)

a* a出现0次或者多次

a+ a出现1次或者多次

a? a出现0次或者一次

a{6} a出现6次

a{2,6} a出现2-6次

a{2,} a出现两次以上

或运算符(OR Operator)

(a|b) 匹配

(ab)|(cd) 匹配ab或者cd

字符类(Character Classes)

[abc] 匹配a或者b或者c

[a-c] 同上

[a-fA-F0-9] 匹配小写+大写英文字符以及数字

[^0-9] 匹配非数字字符

元字符(Meta-characters)

\d 匹配数字字符

\D 匹配非数字字符

\w 匹配单词字符(英语,数字,下划线)

\W 匹配非单词字符

\s 匹配空白符号

\S 匹配非空白字符

. 匹配任意字符(除换行符)

\bword\b \b标注字符的边界(全字匹配)

^ 匹配行首

$ 匹配行尾

贪婪/懒惰匹配(Greey/Lazy Match)

<.+>默认贪婪匹配"任意字符"

<.+?>懒惰匹配"任意字符"