Python 正则表达式语法

Python 中的正则表达式是通过 re 模块提供的,它支持大多数正则表达式的语法。以下是一些基本的正则表达式语法元素:

  1. 字符匹配:

    • . 匹配任意单个字符,除了换行符。
    • \d 匹配任意数字,等同于 [0-9]
    • \D 匹配任意非数字字符,等同于 [^0-9]
    • \w 匹配任意字母、数字或下划线,等同于 [a-zA-Z0-9_]
    • \W 匹配任意非字母、数字或下划线字符。
  2. 字符类:

    • [abc] 匹配方括号内的任意一个字符。
    • [a-z] 匹配任意小写字母。
    • [^abc] 匹配除了方括号内的任意一个字符。
  3. 量词:

    • * 匹配前面的元素零次或多次。
    • + 匹配前面的元素一次或多次。
    • ? 匹配前面的元素零次或一次。
    • {m} 匹配确定的 m 次。
    • {m,} 至少匹配 m 次。
    • {m,n} 匹配从 m 到 n 次。
  4. 分组:

    • () 创建一个分组,可以捕获匹配的文本。
  5. 选择:

    • | 表示逻辑或,匹配两个表达式中的任意一个。
  6. 断言:

    • ^ 匹配字符串的开头。
    • $ 匹配字符串的结尾。
    • \b 匹配单词边界。
    • \B 匹配非单词边界。
  7. 特殊序列:

    • \s 匹配任何空白字符。
    • \S 匹配任何非空白字符。
    • \t 匹配制表符。
    • \n 匹配换行符。
  8. 转义:

    • \ 用于转义特殊字符或表示特殊序列。
  9. 贪婪与非贪婪:

    • 默认情况下,量词是贪婪的,尽可能多地匹配字符。在量词后面加上 ? 使其变为非贪婪,尽可能少地匹配字符。
  10. 注释:

    • (?#comment) 正则表达式中的注释,Python 3.9 及以上版本支持。

使用 re 模块的基本步骤通常包括:

  • 导入模块:import re
  • 编译正则表达式:pattern = re.compile(r'正则表达式')
  • 使用方法,如 match(), search(), findall(), sub() 等。

例如,要匹配一个邮箱地址,可以使用以下正则表达式:

python 复制代码
import re

email_pattern = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'
emails = re.findall(email_pattern, 'Please contact us at support@example.com or sales@example.net.')
print(emails)  # ['support@example.com', 'sales@example.net']

请注意,正则表达式可以非常强大,但也可能变得复杂和难以理解。始终确保测试你的正则表达式以确保它们按预期工作。

相关推荐
幽络源小助理3 分钟前
Python使用requests_html库爬取掌阅书籍(附完整源码及使用说明)
python·html·python爬虫·爬虫教程·requests_html·爬取书籍·掌阅
取个名字真难呐4 分钟前
LossMaskMatrix损失函数掩码矩阵
python·深度学习·矩阵
南宫理的日知录5 分钟前
「Python数据科学」标量、向量、矩阵、张量与多维数组的辨析
python·numpy·数据科学
GZ同学23 分钟前
Arcgis中python工具箱制造要点及统计要素图层字段信息工具分享
python·arcgis
北京_宏哥1 小时前
python接口自动化(四十二)- 项目架构设计之大结局(超详解)
python·架构·前端框架
Auc241 小时前
使用scrapy框架爬取微博热搜榜
开发语言·python
梦想画家2 小时前
Python Polars快速入门指南:LazyFrames
python·数据分析·polars
程序猿000001号2 小时前
使用Python的Seaborn库进行数据可视化
开发语言·python·信息可视化
API快乐传递者2 小时前
Python爬虫获取淘宝详情接口详细解析
开发语言·爬虫·python
公众号Codewar原创作者2 小时前
R数据分析:工具变量回归的做法和解释,实例解析
开发语言·人工智能·python