【Python】正则表达式

在Python中,正则表达式相关的函数主要定义在re模块中。以下是一些常用的正则表达式函数及其说明:

正则表达式基本语法

1. 元字符

  • . :匹配除换行符外的任何单个字符。
    • 示例a.b 可以匹配 acba1b 等。
  • ^ :匹配字符串的开始。
    • 示例^Hello 匹配以 Hello 开始的字符串。
  • $ :匹配字符串的结束。
    • 示例world$ 匹配以 world 结束的字符串。
  • * :匹配前面的字符零次或多次。
    • 示例a* 匹配 """a""aa" 等。
  • + :匹配前面的字符一次或多次。
    • 示例a+ 匹配 "a""aa",但不匹配 ""
  • ? :匹配前面的字符零次或一次。
    • 示例a? 匹配 """a"
  • {n} :匹配前面的字符恰好 n 次。
    • 示例a{2} 匹配 "aa"
  • {n,} :匹配前面的字符至少 n 次。
    • 示例a{2,} 匹配 "aa""aaa" 等。
  • {n,m} :匹配前面的字符至少 n 次,且不超过 m 次。
    • 示例a{1,3} 匹配 "a""aa""aaa"

2. 字符类

  • [...] :匹配字符集中的任意一个字符。
    • 示例[abc] 匹配 abc
  • [^...] :匹配不在字符集中的任意字符。
    • 示例[^abc] 匹配除 abc 以外的字符。
  • \d :匹配任何数字,等同于 [0-9]
    • 示例\d+ 匹配一个或多个数字。
  • \D :匹配任何非数字字符。
    • 示例\D+ 匹配一个或多个非数字字符。
  • \w :匹配任何字母数字字符,等同于 [a-zA-Z0-9_]
    • 示例\w+ 匹配一个或多个字母数字字符。
  • \W :匹配任何非字母数字字符。
    • 示例\W+ 匹配一个或多个非字母数字字符。
  • \s :匹配任何空白字符,包括空格、制表符等。
    • 示例\s+ 匹配一个或多个空白字符。
  • \S :匹配任何非空白字符。
    • 示例\S+ 匹配一个或多个非空白字符。

3. 断言

  • (?=...) :正向预测,检查后面是否匹配某模式,但不消耗字符。
    • 示例a(?=b) 匹配 a,后面跟着 b
  • (?!...) :负向预测,检查后面是否不匹配某模式。
    • 示例a(?!b) 匹配 a,后面不跟 b

4. 分组

  • (...) :用于分组,可以应用量词或捕获匹配结果。
    • 示例(abc)+ 匹配一个或多个 abc

5. 示例代码

下面是一个使用Python的正则表达式示例,演示如何使用上述语法:

import re  

text = "Hello 123, this is a test: http://example.com/abc."  

# 示例匹配数字  
numbers = re.findall(r'\d+', text)  
print("数字:", numbers)  # 输出: 数字: ['123']  

# 示例以Hello开头的字符串  
if re.match(r'^Hello', text):  
    print("字符串以'Hello'开头")  

# 示例匹配URL  
url_matches = re.findall(r'http://[a-zA-Z0-9./]+', text)  
print("URL:", url_matches)  # 输出: URL: ['http://example.com/abc']  

# 示例匹配以abc结束的字符串  
if re.search(r'abc\.', text):  
    print("字符串中包含以'abc.'结尾的部分")

常用正则表达式函数

在Python中,正则表达式相关的函数主要定义在 re 模块中。以下是一些常用的正则表达式函数及示例:

1. re.match()
  • 描述:从字符串的开始位置匹配一个模式。

  • 示例

    import re

    result = re.match(r'Hello', 'Hello, world!')
    if result:
    print("匹配成功:", result.group()) # 输出: 匹配成功: Hello

2. re.search()
  • 描述:在整个字符串中搜索第一个匹配。

  • 示例

    result = re.search(r'world', 'Hello, world!')
    if result:
    print("匹配成功:", result.group()) # 输出: 匹配成功: world

3. re.findall()
  • 描述:返回字符串中所有与模式匹配的非重叠部分。

  • 示例

    result = re.findall(r'\d+', 'There are 42 apples and 365 oranges.')
    print("匹配结果:", result) # 输出: 匹配结果: ['42', '365']

4. re.finditer()
  • 描述:返回一个匹配对象的迭代器。

  • 示例

    for match in re.finditer(r'\d+', 'There are 42 apples and 365 oranges.'):
    print("匹配结果:", match.group()) # 输出: 42, 365

5. re.sub()
  • 描述:替换字符串中所有匹配的部分。

  • 示例

    result = re.sub(r'apples', 'bananas', 'There are 42 apples and 365 oranges.')
    print("替换结果:", result) # 输出: 替换结果: There are 42 bananas and 365 oranges.

6. re.split()
  • 描述:根据模式分割字符串。

  • 示例

    result = re.split(r'[,\s;.]', 'one, two; three.four five')
    print("分割结果:", result) # 输出: ['one', 'two', 'three', 'four', 'five']

7. re.compile()
  • 描述:将正则表达式编译为对象以提高后续匹配效率。

  • 示例

    pattern = re.compile(r'\d+')
    result = pattern.findall('There are 42 apples and 365 oranges.')
    print("匹配结果:", result) # 输出: 匹配结果: ['42', '365']

8. re.fullmatch()
  • 描述:检查整个字符串是否与模式完全匹配。

  • 示例

    result = re.fullmatch(r'\d+', '1234')
    if result:
    print("完全匹配成功:", result.group()) # 输出: 完全匹配成功: 1234

9. re.escape()
  • 描述:转义所有正则表达式中的特殊字符。

  • 示例

    text = "1 + 2 = 3"
    escaped_text = re.escape(text)
    print("转义结果:", escaped_text) # 输出: 转义结果: 1\ +\ 2\ =\ 3

相关推荐
一念之坤1 小时前
零基础学Python之数据结构 -- 01篇
数据结构·python
wxl7812271 小时前
如何使用本地大模型做数据分析
python·数据挖掘·数据分析·代码解释器
NoneCoder1 小时前
Python入门(12)--数据处理
开发语言·python
LKID体2 小时前
Python操作neo4j库py2neo使用(一)
python·oracle·neo4j
小尤笔记2 小时前
利用Python编写简单登录系统
开发语言·python·数据分析·python基础
FreedomLeo12 小时前
Python数据分析NumPy和pandas(四十、Python 中的建模库statsmodels 和 scikit-learn)
python·机器学习·数据分析·scikit-learn·statsmodels·numpy和pandas
007php0073 小时前
GoZero 上传文件File到阿里云 OSS 报错及优化方案
服务器·开发语言·数据库·python·阿里云·架构·golang
Tech Synapse3 小时前
Python网络爬虫实践案例:爬取猫眼电影Top100
开发语言·爬虫·python
一行玩python4 小时前
SQLAlchemy,ORM的Python标杆!
开发语言·数据库·python·oracle
数据小爬虫@4 小时前
利用Python爬虫获取淘宝店铺详情
开发语言·爬虫·python