python的正则表达式

文章目录

正则表达式

Python 的正则表达式(Regular Expression)功能非常强大,它允许你进行复杂的字符串匹配和查找。Python 中使用正则表达式的标准库是 re。

基本使用

下面是一些基本的使用方式:

匹配字符串

python 复制代码
import re

pattern = "abc"
text = "abcdef abcdef"

match = re.search(pattern, text)

if match:
    print("找到匹配:", match.group())
else:
    print("没有找到匹配")

查找所有匹配

python 复制代码
import re

pattern = "abc"
text = "abcdef abcdef abcdef"

matches = re.findall(pattern, text)

print("找到所有匹配:", matches)

替换字符串

python 复制代码
import re

pattern = "abc"
replace_with = "xyz"
text = "abcdef abcdef abcdef"

new_text = re.sub(pattern, replace_with, text)

print("替换后的文本:", new_text)

元字符

正则表达式包含一些特殊字符(称为元字符),它们具有特殊的含义:

  • . : 匹配除换行符以外的任意字符
  • ^ : 匹配字符串的开头
  • $ : 匹配字符串的末尾
    • : 匹配前面的子表达式零次或多次
    • : 匹配前面的子表达式一次或多次
  • ? : 匹配前面的子表达式零次或一次
  • {m,n} : 匹配前面的子表达式至少 m 次且最多 n 次

字符集

  • ... : 匹配字符集内的任意一个字符
  • \^... : 匹配不在括号内的任意字符
  • \d : 匹配一个数字字符,等价于 0-9
  • \D : 匹配一个非数字字符,等价于 \^0-9
  • \w : 匹配包括下划线的任何单词字符,等价于 A-Za-z0-9_
  • \W : 匹配任何非单词字符,等价于 \^A-Za-z0-9_
  • \s : 匹配任何空白字符,包括空格、制表符、换页符等等,等价于 \\f\\n\\r\\t\\v
  • \S : 匹配任何非空白字符,等价于 \^ \\f\\n\\r\\t\\v

分组和引用

  • (...) : 匹配括号内的表达式,也表示一个组
  • \number : 引用编号为 number 的组匹配到的文本

re.match函数

函数原型

python 复制代码
re.match(pattern, string, flags=0)
  • pattern: 正则表达式的模式字符串。
  • string: 要匹配的字符串。
  • flags: 可选参数,用于修改正则表达式的匹配方式,如忽略大小写、多行模式等。可能的值包括:
    • re.I: 忽略大小写
    • re.M: 多行模式
    • re.S: 使.匹配包括换行符在内的所有字符
    • re.X: 允许使用空格和#注释正则表达式

示例

python 复制代码
import re

# 匹配字符串开头的 "Hello"
pattern = "Hello"
string = "Hello, world!"

match = re.match(pattern, string)

if match:
    print("找到匹配:", match.group())
else:
    print("没有找到匹配")

输出将是:

python 复制代码
找到匹配: Hello

如果尝试匹配的字符串不是以"Hello"开头,re.match()将返回None。

python 复制代码
string = "Hi, world!"
match = re.match(pattern, string)

if match:
    print("找到匹配:", match.group())
else:
    print("没有找到匹配")

输出将是:

python 复制代码
没有找到匹配

注意事项

  • re.match()只匹配字符串的开始部分,如果模式出现在字符串的中间或结尾,它将不会匹配。
  • 如果你想检查整个字符串是否与模式匹配,可以使用re.fullmatch()。
  • 如果你想查找字符串中的所有匹配项,可以使用re.findall()或re.finditer()。
相关推荐
myenjoy_11 小时前
MQTT 与 Sparkplug B——从车间到云端的最后一公里
网络·python
颜酱2 小时前
LangChain 输出解析器:把模型回复变成你要的数据
python·langchain
2401_873479402 小时前
企业安全运营中,如何用IP离线库提前发现失陷主机?三步实现风险画像
网络·数据库·python·tcp/ip·ip
weixin_523185322 小时前
Java基础知识总结(四):引用数据类型与参数传递机制
java·开发语言·python
码农飞哥3 小时前
我把RAG召回率从60%提到90%,就改了这两件事
python·知识库·向量检索·rag·效果提示
宸津-代码粉碎机3 小时前
Spring AI企业级实战|从RAG优化到Agent多工具调度
java·大数据·人工智能·后端·python·spring
yuhuofei20213 小时前
【Python入门】Python中的字典dict
python
Jinkxs3 小时前
Python基础 - 文件的写入操作 write与writelines方法
android·服务器·python
初学Python的小明4 小时前
Python格式化输出、运算符、分支&循环
python
92year4 小时前
用 browser-use 让 AI 自己操作浏览器:从安装到自动填表全流程
python·ai·浏览器自动化·browser-use