入门re 正则表达式

1.字符匹配:

a:匹配字符 a

abc:匹配字符串 abc

python 复制代码
import re

result = re.search(r"a", "abcabcd", re.I)
print(result, type(result), result.start(), result.end(), result.group())

result = re.findall(r"abc", "abcabcd", re.I)
print(result)

2.特殊字符:

.:匹配除换行符外的任何单个字符。

python 复制代码
import re
result = re.findall(r".", "abc123=+^$( &% \n", re.S)
print(result)

\d:匹配任何数字,相当于 [0-9]

python 复制代码
import re
result = re.findall(r"\d", "123abc=+*&%#_(^@!")
print(result)

\D:匹配任何非数字字符。

python 复制代码
import re
result = re.findall(r"\D", "123abc=+*&%#_(^@!")
print(result)

\w:匹配任何字母数字字符,相当于 [a-zA-Z0-9_]

python 复制代码
import re
result = re.findall(r"\w", "123abc=+*&%#_(^@!")
print(result)

\W:匹配任何非字母数字字符。

python 复制代码
import re
result = re.findall(r"\W", "123abc=+*&%#_(^@!")
print(result)

\s:匹配任何空白字符(空格、制表符、换行符等)。

python 复制代码
import re
result = re.findall(r"\s", " 123 abc =+*& %#_(^@!")
print(result)

\S:匹配任何非空白字符。

python 复制代码
import re
result = re.findall(r"\S", " 123 abc =+*& %#_(^@!")
print(result)

3.字符集:

[abc]:匹配字符 abc 中的任何一个。

python 复制代码
import re
result = re.match(r"[abc]", "abcabcd")
print(result)

[a-z]:匹配小写字母中的任何一个。

[A-Z]:匹配大写字母中的任何一个。

[0-9]:匹配任何数字。

python 复制代码
import re

result = re.findall(r"[123]", "12345abcdef")
print(result)

result = re.findall(r"[1-5a-f]", "12345abcdef")
print(result)

4.字符集的否定:

[^abc]:匹配除 abc 之外的任何字符。

python 复制代码
import re
result = re.findall(r"^abc", "abc123=+^$ \na( &% ", re.M)
print(result)

5.数量词:

*:匹配前面的元素零次或多次。

python 复制代码
import re

result = re.findall(r"\d*", "12345")
print(result)

result = re.findall(r"\d*?", "12345")
print(result)

+:匹配前面的元素一次或多次。

python 复制代码
import re

result = re.findall(r"\d+", "12345")
print(result)

result = re.findall(r"\d+?", "12345")
print(result)

?:匹配前面的元素零次或一次。

python 复制代码
import re

result = re.findall(r"\d?", "12345")
print(result)

result = re.findall(r"\d??", "12345")
print(result)

{n}:匹配前面的元素正好 n 次。

{n,}:匹配前面的元素至少 n 次。

{n,m}:匹配前面的元素至少 n 次,但不超过 m 次。

python 复制代码
import re

result = re.findall(r"\d{3}", "12345")
print(result)

result = re.findall(r"\d{2,4}?", "12345")
print(result)

6.位置与边界:

^:匹配输入字符串的开始位置。(re.S,re.M 可以多行检测)

python 复制代码
import re
result = re.findall(r"^a", "abc123=+^$ \na( &% ", re.M)
print(result)

$:匹配输入字符串的结束位置。

python 复制代码
import re
result = re.findall(r" $", "abc123=+^$ \na( &% ", re.M)
print(result)

\b:匹配单词边界。

python 复制代码
import re
result = re.findall(r"\b", "abcdef")
print(result)

\B:匹配非单词边界。

python 复制代码
import re
result = re.findall(r"\B", "abcdef")
print(result)

7.分组和选择:

(abc):匹配并捕获子表达式 abc

python 复制代码
import re

result = re.search(r"(.*)4(.*)c(.*)f", "12345abcdef")
print(result, result.group(), result.group(1), result.group(2), result.group(3))

result = re.findall(r"(.*)4(.*)c(.*)f", "12345abcdef")
print(result[0][0], result[0][1], result[0][2])

a|b:匹配 ab

python 复制代码
import re
result = re.findall(r"[1-5]|[a-f]", "12345abcdef")
print(result)
相关推荐
一百天成为python专家13 小时前
python爬虫入门(小白五分钟从入门到精通)
开发语言·爬虫·python·opencv·yolo·计算机视觉·正则表达式
蓝桉~MLGT1 天前
Python学习历程——字符串相关操作及正则表达式
python·学习·正则表达式
一晌小贪欢1 天前
Python爬虫第5课:正则表达式与数据清洗技术
爬虫·python·正则表达式·网络爬虫·python爬虫·python3·网页爬虫
MANONGMN2 天前
Linux 通配符与正则表达式(含实战案例+避坑指南)
linux·运维·正则表达式
带土12 天前
18 .shell编程-正则表达式
linux·正则表达式
2025年一定要上岸3 天前
【日常学习】10-15 学习re
学习·算法·正则表达式
Penguin_zlh7 天前
基础 - 正则表达式
正则表达式
超级大只老咪7 天前
正则表达式
正则表达式
千叶寻-7 天前
正则表达式
前端·javascript·后端·架构·正则表达式·node.js
XYiFfang8 天前
【MYSQL】SQL学习指南:从常见错误到高级函数与正则表达式
sql·mysql·正则表达式·regexp_like·group_concat