正则表达式核心语法 + Python的 re 库中常用方法

**正则表达式(Regular Expression,re):**一种用于匹配、查找或替换文本中特定模式的强大工具。

一、re的核心语法

1、基本匹配

语法 说明 示例(表达式 → 匹配示例)
abc 匹配字面值 "abc" "abc""abc"
. 匹配任意单个字符 (除换行符 \n "a.c""abc", "a c"
\ 转义特殊字符(如 \. 匹配点号) "a\.c""a.c"
` ` 或逻辑(匹配左边或右边的表达式)

2、字符类

语法 说明 示例(表达式 → 匹配示例)
[abc] 匹配 abc "[aeiou]""e" in "hello"
[^abc] 匹配非 abc 的字符 "[^0-9]""a" in "a1"
[a-z] 匹配小写字母(范围) "[a-z]""h" in "Hi"
[A-Z0-9] 匹配大写字母或数字 "[A-Z0-9]""H", "1"

3、量词(重复匹配)

语法 说明 示例(表达式 → 匹配示例)
* 匹配前一项 0次或多次 "a*""", "aaa"
+ 匹配前一项 1次或多次 "a+""a", "aaa"
? 匹配前一项 0次或1次 "a?""", "a"
{n} 匹配前一项 恰好n次 "a{2}""aa"
{n,} 匹配前一项 至少n次 "a{2,}""aaa"
{n,m} 匹配前一项 n到m次 "a{2,3}""aa", "aaa"

4、贪婪 vs 非贪婪

语法 说明 示例(表达式 → 匹配示例)
* 贪婪匹配(尽可能多) "a.*b""aabb" in "aabbaab"
*? 非贪婪匹配(尽可能少) "a.*?b""aab" in "aabbaab"
+? 非贪婪的 + "a.+?b""aab"

5、预定义字符类

语法 说明 等价写法 → 匹配示例
\d 数字([0-9] "a\d""a1"
\D 非数字([^0-9] "a\D""ab"
\w 单词字符([a-zA-Z0-9_] "\w+""word_"
\W 非单词字符 "\W""!"
\s 空白字符(空格、制表符等) "a\sb""a b"
\S 非空白字符 "a\Sb""a1b"

6、边界匹配

语法 说明 示例(表达式 → 匹配示例)
^ 匹配字符串开头 "^a""a" in "abc"
$ 匹配字符串结尾 "c$""c" in "abc"

二、Python的 re 库中常用的基本方法

1、核心匹配方法

方法 语法 返回值 功能说明 示例
re.match() re.match(pattern, string) Match 对象或 None 从字符串开头匹配 re.match(r'\d+', '123abc').group()'123'
re.search() re.search(pattern, string) Match 对象或 None 扫描整个字符串匹配第一个 re.search(r'\d+', 'abc123').group()'123'
re.findall() re.findall(pattern, string) 列表 返回所有匹配的子串 re.findall(r'\d+', 'a1b22c333')['1', '22', '333']

代码示例:

python 复制代码
# match()方法错误示范
text = "邮箱:user.LiLi-103@example.com"
email_pattern = r'^[a-zA-Z0-9.-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$'
res = re.match(email_pattern, text)
if res:
    print(res.group())   
# 没有输出,因为文本开头是邮箱,而match()方法只从字符串开头匹配正则表达式,res为None



# match()方法正确使用:修改text,或使用search()方法
text = "user.LiLi-103@example.com"
email_pattern = r'^[a-zA-Z0-9.-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$'
res = re.match(email_pattern, text)
if res:
    print(res.group())  
# 输出为:user.LiLi-103@example.com
python 复制代码
# search()
text = "abc123def456"
result = re.search(r'\d+', text)  # 查找第一个数字序列

if result:
    print("找到数字:", result.group())  # 输出: 123
else:
    print("未找到数字")
python 复制代码
# findall()
text = "a156b22c333d"
results = re.findall(r'\d+', text)  # 查找所有数字序列

print("所有数字:", results)  # 输出: ['156', '22', '333']

注: .group()方法用于提取匹配的内容。如re.match()方法返回结果的是Match 对象,而不是匹配的内容,需要使用group()提取匹配内容。

2. 替换与分割

方法 语法 返回值 功能说明 示例
re.sub() re.sub(pattern, repl, string, count=0) 字符串 替换匹配的子串。 count:最大替换次数(默认 0 表示全部替换) re.sub(r'\d+', 'X', 'a1b22')'aXbX'
re.split() re.split(pattern, string, maxsplit=0) 列表 按正则表达式分割字符串 re.split(r'\d+', 'a1b22c3')['a', 'b', 'c', '']

代码示例:

python 复制代码
import re

# 替换所有匹配项
text = "Python is great. Python is easy."
result = re.sub(r'Python', 'Java', text)  
print(result)  
# 输出: "Java is great. Java is easy."


# 只替换第一个
result = re.sub(r'Python', 'Java', text, count=1)  
print(result)  
# 输出: "Java is great. Python is easy."
python 复制代码
text = "apple?banana,cherry.egg right"
result = re.split(r'[,.? ]', text)  # 按[,.? ]分割
print(result)  
# 输出: ['apple', 'banana', 'cherry', 'egg']


result = re.split(r'[,.? ]', text, maxsplit=1)  # 只分割一次
print(result)  
# 输出: ['apple', 'banana,cherry.egg right']

# 文章如有错误,欢迎大家指正。我们下期再见

相关推荐
xcLeigh1 小时前
Python入门:Python3 正则表达式全面学习教程
python·学习·正则表达式·教程·python3
多恩Stone2 小时前
【C++ debug】在 VS Code 中无 Attach 调试 Python 调用的 C++ 扩展
开发语言·c++·python
XW01059993 小时前
4-11判断素数
前端·python·算法·素数
深蓝电商API3 小时前
爬虫增量更新:基于时间戳与哈希去重
爬虫·python
两万五千个小时3 小时前
构建mini Claude Code:06 - Agent 如何「战略性遗忘」(上下文压缩)
人工智能·python
两万五千个小时3 小时前
构建mini Claude Code:12 - 从「文件冲突」到「分身协作」:Worktree 如何让多 Agent 安全并行
人工智能·python·架构
yuki_uix3 小时前
为什么我的 Auth Token 藏在了 Network 面板的 Doc 里?
前端·python·debug
甲枫叶4 小时前
【claude+weelinking产品经理系列16】数据可视化——用图表讲述产品数据的故事
java·人工智能·python·信息可视化·产品经理·ai编程
番茄去哪了4 小时前
Python基础入门(二)
linux·服务器·开发语言·python