正则表达式

正则表达式

import re

限定符(quantifier)

a* a出现0次或者多次

a+ a出现1次或者多次

a? a出现0次或者一次

a{6} a出现6次

a{2,6} a出现2-6次

a{2,} a出现两次以上

或运算符(OR Operator)

(a|b) 匹配

(ab)|(cd) 匹配ab或者cd

字符类(Character Classes)

abc\] 匹配a或者b或者c \[a-c\] 同上 \[a-fA-F0-9\] 匹配小写+大写英文字符以及数字 \[\^0-9\] 匹配非数字字符 ### 元字符(Meta-characters) \\d 匹配数字字符 \\D 匹配非数字字符 \\w 匹配单词字符(英语,数字,下划线) \\W 匹配非单词字符 \\s 匹配空白符号 \\S 匹配非空白字符 . 匹配任意字符(除换行符) \\bword\\b \\b标注字符的边界(全字匹配) \^ 匹配行首 $ 匹配行尾 ### 贪婪/懒惰匹配(Greey/Lazy Match) \<.+\>默认贪婪匹配"任意字符" \<.+?\>懒惰匹配"任意字符"