正则表达式

正则表达式

组成

元字符+普通字符

普通字符

大小写字母、数字、标点符号及一些其他符号

元字符

在正则表达式中具有特殊意义的专用字符

常用的元字符

  • \:转义字符,!、\n等
  • ^:匹配字符串开始的位置
    • 例: a、the、^#
  • $:匹配字符串结束的位置
    • 例: word$
  • .:匹配除\n之外的任意的一个字符
    • 例: go.d、g...d
  • *:匹配前面子表达式0次或者多次
    • 例:goo*d、go.*d
  • [list]:匹配list列表中的一个字符
    • 例: go[ola]d,[abc]、[a-z]、[a-z0-9]
  • [^list]:匹配任意不在list列表中的一个字符
    • 例: [a-z]、[0-9]、[^A-Z0-9]
  • {n,m}:匹配前面的子表达式n到m次,有{n}、{n,}、{n,m}三种格式
    • 例:go{2}d、go{2,3}d、go{2,}d
    • {n}:匹配前面的子表达式恰好 n 次。
    • {n,}:匹配前面的子表达式至少 n 次,可以无限多次。
    • {n,m}:匹配前面的子表达式至少 n 次,但不超过 m 次。
  • [[:punct:]] → 匹配标点符号字符
    • 例如[[:punct:]] → :

扩展元字符

  • +:匹配前面子表达式1次以上
    • 例: go+d,将匹配至少一个o
  • ?:匹配前面子表达式0次或者1次
    • 例: go?d,将匹配gd或god
  • ():将括号中的字符串作为一个整体
    • 例:(xyz)+,将匹配 xyz 整体1次以上,如xyzxyz
  • |:以或的方式匹配字条串
    • 例1: good|food,将匹配good或者food
    • 例2: g(oo|la)d,将匹配good或者glad

表示一类字符的原子

  • \d:表示一个十进制的数字 [0-9]
    \D:表示非数字
  • \w:表示一个字 [0-9a-zA-Z_]
    \W:表示除[0-9a-zA-Z_]之外的字符
  • \s:表示一个空白字符(空格,tab,换页符等)
    \S:表示一个非空白字符
  • \i: 表示不区分大小写
相关推荐
九皇叔叔1 天前
Linux Shell 正则表达式中的 POSIX 字符集:用法与实战
linux·运维·正则表达式
m0_64880493_江哥3 天前
用正则方法从中英文本提取英文的python示例
python·mysql·正则表达式
九皇叔叔3 天前
Linux Shell 正则表达式:从入门到实战,玩转文本匹配与处理
linux·mysql·正则表达式
一百天成为python专家3 天前
python爬虫入门(小白五分钟从入门到精通)
开发语言·爬虫·python·opencv·yolo·计算机视觉·正则表达式
蓝桉~MLGT4 天前
Python学习历程——字符串相关操作及正则表达式
python·学习·正则表达式
一晌小贪欢4 天前
Python爬虫第5课:正则表达式与数据清洗技术
爬虫·python·正则表达式·网络爬虫·python爬虫·python3·网页爬虫
MANONGMN5 天前
Linux 通配符与正则表达式(含实战案例+避坑指南)
linux·运维·正则表达式
带土15 天前
18 .shell编程-正则表达式
linux·正则表达式
2025年一定要上岸6 天前
【日常学习】10-15 学习re
学习·算法·正则表达式
Penguin_zlh9 天前
基础 - 正则表达式
正则表达式