Python中re模块的使用

在Python中,处理正则表达式的模块是re模块。通过re模块,可以使用正则表达式来进行字符串的匹配、查找、替换等操作。执行效率特别高,可读性不强。

1.方法

match 从头开始匹配 返回Match 或者None

python 复制代码
import re
r = re.match(".\w{10}", "Hello_world hi world", re.I)
print(type(r), r)
if r:
    print(r.group())

search 匹配整个字符串 返回Match 或者None

python 复制代码
r = re.search(r"\d", "1a2b3c")
print(type(r), r)
if r:
    print(r.group())

fullmatch 从头开始匹配 返回Match 或者None

python 复制代码
r = re.fullmatch(r"\d", "12345")
print(type(r), r)
if r:
    print(r.group())

finditer 找到所有,返回迭代器,其中的每一个元素都是Match

python 复制代码
r = re.finditer(r"\d", "1a2b3c4d")
print(r, type(r))

findall 找到所有,返回列表或者空列表

split 切割,返回列表

sub 替换,返回字符串

subn 替换,返回元组(新字符串,替换个数)

python 复制代码
r = re.split(r"\d", "1a2b3c4d", 2)
print(r, type(r))

r = re.sub(r"\d", "+", "1a2b3c4d5e6f7g", 2)
print(r, type(r))

r = re.subn(r"\d", "+", "1a2b3c4d5e6f7g", 2)
print(r, type(r))

2.字符匹配

. 匹配任意字符

\d 匹配数字

\D 非数字

\w 字母数字下划线

\W 非字母数字下划线

\s 空白字符 :空格 制表符 换行符

\S 非空白字符

python 复制代码
r = re.findall(r".", "hello world+-*/")
r = re.findall(r"\d\D", "he1llo33 wor5ld+-*/")
r = re.findall(r"\w\W", "hel.lo33_wor_ld+-*/")
r = re.findall(r"\s\S", "hell o33\n world+-*/")

print(type(r), r)

3.重复

* 出现0-n次

  • 有1-n次

? 有0或1个

.* 默认是贪婪模式(尽可能多匹配) .*? 非贪婪模式(尽可能少匹配)

{n}匹配n次

{m,n}匹配m-n次

python 复制代码
import re
r = re.findall(r"a*b", "aaabcabcdc")
print(r, type(r))

r = re.findall(r"a+b", "aaabcabcdc")
print(r, type(r))

r = re.findall(r"a?", "aaabcabcdc")
print(r, type(r))

r = re.findall(r".*?", "aaabcabcdc")
print(r, type(r))

r = re.findall(r"\d{2}", "12345")
print(r, type(r))

r = re.findall(r"\d{3,5}", "123456789")
print(r, type(r))

4.边界

^ 以开头

$ 以结尾

\b 匹配单词边界

\B 匹配非单词边界

python 复制代码
r = re.findall(r"^.*?\b$", "hello world\tlove China")
print(r, type(r))

5.标识符

re.I 忽略大小写

re.M 多行模式,如果有换行符

re.S 单行模式

python 复制代码
r = re.findall(r"^a.*?d$", "abcd\n1a2b3c4d\n+-*/", re.M)
print(r, type(r))

6.特殊字符

abcdefg\] 只能取一个 \[\^abcdefg\] 不在abcdefg中间 \[a-z0-9A-Z\] 所有数字字母下划线 相当于\\w ```python import re r = re.findall(r"a[bc]d", "abdacdaedafd") print(r, type(r)) r = re.findall(r"^abc", "abdacdabcdedafd") print(r, type(r)) r = re.findall(r"a[a-z0-9A-Z_]d", "abdacdaedafda1da2da3da9daMdaZd") print(r, type(r)) ``` () 分组 \\n 取前面的分组匹配的内容 ( \| ) 分组 ```python import re r = re.findall(r"()", "abcd1234abc123") print(r, type(r)) r = re.findall(r"(\d\d|ab)-\d", "13-24ab-2a") print(r, type(r)) ```

相关推荐
Percep_gan3 分钟前
解决java.security.InvalidKeyException: Illegal key size
java·开发语言
西部秋虫28 分钟前
YOLO 训练车牌定位模型 + OpenCV C++ 部署完整步骤
c++·python·yolo·车牌识别
CryptoPP1 小时前
使用 KLineChart 这个轻量级的前端图表库
服务器·开发语言·前端·windows·后端·golang
18你磊哥1 小时前
chromedriver.exe的使用和python基本处理
开发语言·python
小坏讲微服务1 小时前
Spring Cloud Alibaba 整合 Scala 教程完整使用
java·开发语言·分布式·spring cloud·sentinel·scala·后端开发
Kiri霧1 小时前
Scala 循环控制:掌握 while 和 for 循环
大数据·开发语言·scala
闲人编程1 小时前
Python的抽象基类(ABC):定义接口契约的艺术
开发语言·python·接口·抽象类·基类·abc·codecapsule
qq_172805591 小时前
Go 语言结构型设计模式深度解析
开发语言·设计模式·golang
vx_dmxq2112 小时前
【微信小程序学习交流平台】(免费领源码+演示录像)|可做计算机毕设Java、Python、PHP、小程序APP、C#、爬虫大数据、单片机、文案
java·spring boot·python·mysql·微信小程序·小程序·idea
无垠的广袤2 小时前
【工业树莓派 CM0 NANO 单板计算机】本地部署 EMQX
linux·python·嵌入式硬件·物联网·树莓派·emqx·工业物联网