Python 正则表达式核心元字符全解析

正则表达式核心元字符全解析

正则表达式的强大功能源于其元字符(特殊符号),它们赋予模式匹配灵活性和精确性。本文系统梳理常见元字符及其应用场景,附实例详解。


✨ 一、择一匹配(|

管道符号实现逻辑"或"操作,匹配多个模式中的任意一个:

  • at|home → 匹配 athome
  • r2d2|c3po → 匹配 r2d2c3po
  • bat|bet|bit → 匹配 bat/bet/bit
    注意:单字符时 [ab] 等效于 a|b,但多字符需显式用 |(如 ab|cd)。

🔹 二、任意字符匹配(.

点号匹配除换行符 \n 外的任意单个字符:

模式 匹配示例
f.o fao, f9o, f#o
.. AA, ab, 12
转义句点:需用 \. 匹配字面句点(如 www\.google\.com)。

📍 三、边界匹配

定位字符串或单词的起止位置:

符号 功能 示例
^ 匹配字符串开头 ^FromFrom xxx
$ 匹配字符串结尾 /bin/*sh$/bin/bash
\b 单词边界 \bthe\bthe (非 there)
\B 非单词边界 \Bthe\Bthere 中的 the

🧩 四、字符集([]

匹配括号内任意单个字符:

  • b[ae]tbat, bet(不匹配 bt
  • [cr][23][dp][o2]r2d2, c3po

特殊功能:

  • 范围:[a-z](小写字母)、[0-9A-F](十六进制)
  • 排除:[^aeiou] → 非元音字符

🔢 五、频次匹配(闭包操作符)

控制模式出现次数:

符号 含义 示例
* 0次或多次 [dn]ot?do, no, dot, not
+ 1次或多次 [a-z]+\.comgoogle.com
? 0次或1次 goo?glegogle, google
{m,n} m到n次 \d{3,5}123, 98765
非贪婪模式:在闭包符后加 ?(如 .*?)匹配最少字符。

⚡ 六、字符集缩写

简化常见字符集表示:

符号 等效 说明
\d [0-9] 数字
\w [A-Za-z0-9_] 字母数字下划线
\s [\t\n\r\f\v] 空白字符
\D [^0-9] 非数字

示例:

  • \w+-\d+name-123, a-1
  • \d{3}-\d{2}-\d{4} → 社保号格式 123-45-6789

🧠 七、分组提取(()

圆括号实现两大功能:

1. 子模式分组

  • (\d{3})? → 可选3位数字组

2. 捕获匹配内容

  • (\w+)-(\d+) 匹配 name-123 时:
    • 子组1:name
    • 子组2:123
      应用场景:数据提取(如日志分析、文本清洗)。

🚀 八、扩展语法(? 符号)

高级功能标记(不创建分组):

语法 功能
(?i) 忽略大小写
(?:...) 非捕获分组
(?P<name>...) 命名分组(通过名称引用)
示例:
  • (?i)python → 匹配 Python, PYTHON
  • (?P<year>\d{4}) 提取命名为 year 的4位数字

💎 总结

正则表达式元字符是文本处理的瑞士军刀,核心技巧包括:

  1. 边界定位 :用 ^/$ 精确锚定起止位置
  2. 灵活匹配[...] 定义字符集,| 实现逻辑或
  3. 频次控制*/+/?/{} 管理重复次数
  4. 数据提取() 分组捕获关键子串

掌握这些符号的组合应用,可高效解决复杂字符串匹配、验证和提取需求。建议通过实际案例(如邮箱验证、URL解析)加深理解。

相关推荐
yzx9910131 分钟前
小程序开发APP
开发语言·人工智能·python·yolo
飞翔的佩奇23 分钟前
【完整源码+数据集+部署教程】二维码与查找模式检测系统源码和数据集:改进yolo11-CSwinTransformer
python·yolo·计算机视觉·数据集·yolo11·二维码与查找模式检测
大霞上仙29 分钟前
实现自学习系统,输入excel文件,能学习后进行相应回答
python·学习·excel
Caven7738 分钟前
【pytorch】reshape的使用
pytorch·python
无规则ai40 分钟前
动手学深度学习(pytorch版):第四章节—多层感知机(5)权重衰减
人工智能·pytorch·python·深度学习
你知道网上冲浪吗2 小时前
【原创理论】Stochastic Coupled Dyadic System (SCDS):一个用于两性关系动力学建模的随机耦合系统框架
python·算法·数学建模·数值分析
杨荧2 小时前
基于Python的宠物服务管理系统 Python+Django+Vue.js
大数据·前端·vue.js·爬虫·python·信息可视化
CodeCraft Studio3 小时前
在 Python 中操作 Excel 文件的高效方案 —— Aspose.Cells for Python
python·ui·excel·报表·aspose·aspose.cells
l1t3 小时前
利用DeepSeek辅助WPS电子表格ET格式分析
人工智能·python·wps·插件·duckdb