【python学习】基础篇-常用模块-re模块:正则表达式高效操作字符串

在Python中,正则表达式主要通过re模块来实现。以下是一些常用的正则表达式用法:

匹配值:

python 复制代码
pattern = r'\d+'  # 匹配一个或多个数字
pattern = r'\b\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}\b' #匹配日期格式
pattern = r'hello'  # 匹配字符串"hello"
  • \d 表示匹配一个数字字符,等价于 [0-9];
  • +表示匹配前面的子表达式一次或多次
  • \d{4}表示匹配四位数字
  • \b 表示单词边界,确保匹配的时间字符串前后没有其他数字或字符,在字符串首尾各一个

1、导入re模块:

python 复制代码
import re

2、使用re.search()函数查找字符串中是否包含指定的模式:

python 复制代码
import re
pattern = r'\d+'  # 匹配一个或多个数字
string = 'abc123def456'
result = re.search(pattern, string)
if result:
    print('找到匹配项:', result.group())
else:
    print('未找到匹配项')

3、使用re.findall()函数查找字符串中所有符合指定模式的子串

python 复制代码
import re
pattern = r'\d+'  # 匹配一个或多个数字
string = 'abc123def456'
result = re.findall(pattern, string)
print('找到的所有匹配项:', result)

4、使用re.sub()函数替换字符串中符合指定模式的子串:

python 复制代码
import re
pattern = r'\d+'  # 匹配一个或多个数字
replacement = 'NUM'
string = 'abc123def456'
result = re.sub(pattern, replacement, string)
print('替换后的字符串:', result)

5、使用re.split()函数根据指定模式分割字符串

python 复制代码
import re
pattern = r'\d+'  # 匹配一个或多个数字
string = 'abc123def456'
result = re.split(pattern, string)
print('分割后的字符串列表:', result)

6、使用re.compile()函数将正则表达式编译为一个模式对象,以便重复使用:

python 复制代码
import re
pattern = re.compile(r'\d+')  # 匹配一个或多个数字

7、使用re.escape()函数对特殊字符进行转义,以便在正则表达式中使用:

python 复制代码
import re
string = 'a.b*c?d+e|f{g}h[i]j^k$l'
escaped_string = re.escape(string)
print('转义后的字符串:', escaped_string)
相关推荐
一道微光7 分钟前
Mac的M2芯片运行lightgbm报错,其他python包可用,x86_x64架构运行
开发语言·python·macos
m0_7482567834 分钟前
WebGIS实战开源项目:智慧机场三维可视化(学习笔记)
笔记·学习·开源
四口鲸鱼爱吃盐35 分钟前
Pytorch | 利用AI-FGTM针对CIFAR10上的ResNet分类器进行对抗攻击
人工智能·pytorch·python
是娜个二叉树!43 分钟前
图像处理基础 | 格式转换.rgb转.jpg 灰度图 python
开发语言·python
互联网杂货铺1 小时前
Postman接口测试:全局变量/接口关联/加密/解密
自动化测试·软件测试·python·测试工具·职场和发展·测试用例·postman
南七澄江2 小时前
各种网站(学习资源及其他)
开发语言·网络·python·深度学习·学习·机器学习·ai
无泡汽水3 小时前
漏洞检测工具:Swagger UI敏感信息泄露
python·web安全
暮暮七3 小时前
理想很丰满的Ollama-OCR
linux·python·大模型·ocr·markdown·ollama
ai_lian_shuo4 小时前
四、使用langchain搭建RAG:金融问答机器人--构建web应用,问答链,带记忆功能
python·ai·金融·langchain·机器人