正则表达式

正则表达式

组成

元字符+普通字符

普通字符

大小写字母、数字、标点符号及一些其他符号

元字符

在正则表达式中具有特殊意义的专用字符

常用的元字符

  • \:转义字符,!、\n等
  • ^:匹配字符串开始的位置
    • 例: a、the、^#
  • $:匹配字符串结束的位置
    • 例: word$
  • .:匹配除\n之外的任意的一个字符
    • 例: go.d、g...d
  • *:匹配前面子表达式0次或者多次
    • 例:goo*d、go.*d
  • [list]:匹配list列表中的一个字符
    • 例: go[ola]d,[abc]、[a-z]、[a-z0-9]
  • [^list]:匹配任意不在list列表中的一个字符
    • 例: [a-z]、[0-9]、[^A-Z0-9]
  • {n,m}:匹配前面的子表达式n到m次,有{n}、{n,}、{n,m}三种格式
    • 例:go{2}d、go{2,3}d、go{2,}d
    • {n}:匹配前面的子表达式恰好 n 次。
    • {n,}:匹配前面的子表达式至少 n 次,可以无限多次。
    • {n,m}:匹配前面的子表达式至少 n 次,但不超过 m 次。
  • [[:punct:]] → 匹配标点符号字符
    • 例如[[:punct:]] → :

扩展元字符

  • +:匹配前面子表达式1次以上
    • 例: go+d,将匹配至少一个o
  • ?:匹配前面子表达式0次或者1次
    • 例: go?d,将匹配gd或god
  • ():将括号中的字符串作为一个整体
    • 例:(xyz)+,将匹配 xyz 整体1次以上,如xyzxyz
  • |:以或的方式匹配字条串
    • 例1: good|food,将匹配good或者food
    • 例2: g(oo|la)d,将匹配good或者glad

表示一类字符的原子

  • \d:表示一个十进制的数字 [0-9]
    \D:表示非数字
  • \w:表示一个字 [0-9a-zA-Z_]
    \W:表示除[0-9a-zA-Z_]之外的字符
  • \s:表示一个空白字符(空格,tab,换页符等)
    \S:表示一个非空白字符
  • \i: 表示不区分大小写
相关推荐
laocooon5238578867 小时前
正则表达式的全面介绍
正则表达式
ben9518chen16 小时前
正则表达式
正则表达式
半路_出家ren17 小时前
17.python爬虫基础,基于正则表达式的爬虫,基于BeautifulSoup的爬虫
网络·爬虫·python·网络协议·正则表达式·网络爬虫·beautifulsoup
Good_Starry2 天前
Java——正则表达式
java·开发语言·正则表达式
@zulnger2 天前
正则表达式
数据库·正则表达式
丁丁点灯o2 天前
oracle中基于正则表达式匹配规则提取子串的函数REGEXP_SUBSTR
数据库·oracle·正则表达式
牛奶咖啡133 天前
shell脚本编程(二)
linux·正则表达式·shell编程·正则表达式扩展·shell通配符·shell的变量·shell的引用
_Kayo_4 天前
JS 正则表达式
正则表达式
游戏23人生4 天前
正则表达式介绍
servlet·正则表达式·unix