Python 正则表达式核心元字符全解析

正则表达式核心元字符全解析

正则表达式的强大功能源于其元字符(特殊符号),它们赋予模式匹配灵活性和精确性。本文系统梳理常见元字符及其应用场景,附实例详解。


✨ 一、择一匹配(|

管道符号实现逻辑"或"操作,匹配多个模式中的任意一个:

  • at|home → 匹配 athome
  • r2d2|c3po → 匹配 r2d2c3po
  • bat|bet|bit → 匹配 bat/bet/bit
    注意:单字符时 [ab] 等效于 a|b,但多字符需显式用 |(如 ab|cd)。

🔹 二、任意字符匹配(.

点号匹配除换行符 \n 外的任意单个字符:

模式 匹配示例
f.o fao, f9o, f#o
.. AA, ab, 12
转义句点:需用 \. 匹配字面句点(如 www\.google\.com)。

📍 三、边界匹配

定位字符串或单词的起止位置:

符号 功能 示例
^ 匹配字符串开头 ^FromFrom xxx
$ 匹配字符串结尾 /bin/*sh$/bin/bash
\b 单词边界 \bthe\bthe (非 there)
\B 非单词边界 \Bthe\Bthere 中的 the

🧩 四、字符集([]

匹配括号内任意单个字符:

  • b[ae]tbat, bet(不匹配 bt
  • [cr][23][dp][o2]r2d2, c3po

特殊功能:

  • 范围:[a-z](小写字母)、[0-9A-F](十六进制)
  • 排除:[^aeiou] → 非元音字符

🔢 五、频次匹配(闭包操作符)

控制模式出现次数:

符号 含义 示例
* 0次或多次 [dn]ot?do, no, dot, not
+ 1次或多次 [a-z]+\.comgoogle.com
? 0次或1次 goo?glegogle, google
{m,n} m到n次 \d{3,5}123, 98765
非贪婪模式:在闭包符后加 ?(如 .*?)匹配最少字符。

⚡ 六、字符集缩写

简化常见字符集表示:

符号 等效 说明
\d [0-9] 数字
\w [A-Za-z0-9_] 字母数字下划线
\s [\t\n\r\f\v] 空白字符
\D [^0-9] 非数字

示例:

  • \w+-\d+name-123, a-1
  • \d{3}-\d{2}-\d{4} → 社保号格式 123-45-6789

🧠 七、分组提取(()

圆括号实现两大功能:

1. 子模式分组

  • (\d{3})? → 可选3位数字组

2. 捕获匹配内容

  • (\w+)-(\d+) 匹配 name-123 时:
    • 子组1:name
    • 子组2:123
      应用场景:数据提取(如日志分析、文本清洗)。

🚀 八、扩展语法(? 符号)

高级功能标记(不创建分组):

语法 功能
(?i) 忽略大小写
(?:...) 非捕获分组
(?P<name>...) 命名分组(通过名称引用)
示例:
  • (?i)python → 匹配 Python, PYTHON
  • (?P<year>\d{4}) 提取命名为 year 的4位数字

💎 总结

正则表达式元字符是文本处理的瑞士军刀,核心技巧包括:

  1. 边界定位 :用 ^/$ 精确锚定起止位置
  2. 灵活匹配[...] 定义字符集,| 实现逻辑或
  3. 频次控制*/+/?/{} 管理重复次数
  4. 数据提取() 分组捕获关键子串

掌握这些符号的组合应用,可高效解决复杂字符串匹配、验证和提取需求。建议通过实际案例(如邮箱验证、URL解析)加深理解。

相关推荐
Miss_min5 小时前
128K长序列数据生成
开发语言·python·深度学习
love530love5 小时前
MingLi-Bench 项目部署实录:基于 EPGF 架构的工程化实践
人工智能·windows·python·架构·aigc·epgf·mingli-bench
猿儿本无心5 小时前
快速搭建Python项目(Vscode+uv+FastAPI)
vscode·python·uv
AI算法沐枫5 小时前
大模型 | 大模型之机器学习基本理论
人工智能·python·神经网络·学习·算法·机器学习·计算机视觉
OzupeSir6 小时前
三门两羊问题 - 蒙提霍尔问题
python·概率论
晚霞的不甘6 小时前
CANN asnumpy 深度解析:NPU 原生 NumPy 的使用指南
人工智能·python·numpy
qingfeng154156 小时前
企业微信 API 自动化开发指南:从消息回调到智能运营实战
java·开发语言·python·自动化·企业微信
Just Jump6 小时前
tornado高性能高并发API服务网关
python·tornado·高并发api服务
晚霞的不甘6 小时前
CANN-MoE模型推理加速实战
人工智能·分布式·python
小新同学^O^6 小时前
简单学习 --> LangChain
python·学习·langchain