Python基础(九)——正则表达式

6.正则表达式

(1)基础匹配

使用re模块

  • match方法:

re.match(匹配规则,被匹配字符串)

从被匹配字符串开头进行匹配,成功则返回匹配对象包含的信息,失败则返回None。

python 复制代码
s = "today is a beautiful day"
result = re.match("today", s)
print(result)
"""
输出:
<re.Match object; span=(0, 5), match='today'>
"""
s = "today is a beautiful day"
result = re.match("day", s)
print(result)
"""
输出:
None
"""
  • search方法:

re.search(匹配规则,被匹配字符串)

从前向后搜索整个字符串,找到第一个匹配的字符串后停止。成功则返回匹配对象包含的信息,失败则返回None。

python 复制代码
b = "Happy Mid-Autumn Festival,tumn"
result2 = re.search("tumn", b)
print(result2)
"""
输出:
<re.Match object; span=(12, 16), match='tumn'>
"""
  • findall方法:

re.findall(匹配规则,被匹配字符串)

搜索匹配整个字符串,找出全部匹配项,找不到则返回空list[]

python 复制代码
b = "Happy Mid-Autumn Festival, tumn"
result2 = re.search("tumn", b)
print(result2)

result3 = re.findall("tumn", b)
print(result3)
"""
输出:
<re.Match object; span=(12, 16), match='tumn'>
['tumn', 'tumn']
"""
(2) 元字符匹配

【在正则中,代码不需要Python规范格式的空格】

代码 功能
单字符匹配
. 匹配任意1个字符,除了\n、.匹配点本身
[] 匹配[]中例举的字符
\d 匹配数字0-9
\D 匹配非数字
\s 匹配空白、空格、tab键
\S 匹配非空白
\w 匹配单词字符,a-z、A-Z、0-9,_
\W 匹配非单词字符
数量匹配
* 匹配前一个规则的字符出现0到无数次
+ 匹配前一个规则的字符出现1到无数次
? 匹配前一个规则的字符出现0或1次
{m} 匹配前一个规则的字符出现m次
{m,} 匹配前一个规则的字符最少出现m次
{m,n} 匹配前一个规则的字符出现m到n次
边界匹配
^ 匹配字符串开头
$ 匹配字符串结尾
\b 匹配一个单词的边界
\B 匹配非单词边界
分组匹配
| 匹配左右任意一个表达式
() 将括号中字符作为一个分组
python 复制代码
a = "20240917.@qq.com!!!"
# r标记表示字符串中转义字符无效,为普通字符
result4 = re.findall(r'\W', a)
result5 = re.findall(r'[a-zA-Z]', a)
result6 = re.findall(r'[abcdqq]', a)

print(result4)
print(result5)
print(result6)
"""
输出:
['.', '@', '.', '!', '!', '!']
['q', 'q', 'c', 'o', 'm']
['q', 'q', 'c']
"""

# 匹配账号,只能由字母和数字组成,长度限制6到10位
r = '^0-9a-zA-Z{6,10}$'
s = '25778&'
print(re.findall(r, s))

# 匹配QQ号,纯数字,长度5-11位,第一位不为0
m = '^[1-9][0-9]{4,10}$'
n = '012345855'
print(re.findall(m, n))

# 匹配邮箱地址,只允许qq、163、gmail三种类型邮箱
q = '(^[\w-]+(\.[\w-]+)*@(qq|163|gmail)(\.[\w-]+)+$)'

# 对于findall方法判断正则表达式时,如果有()分组,则会将每个分组的结果列出,可以使用()将整个表达式作为一组
# abc.qwe.asd@qq.com

记录学习心得的笔记,欢迎大家一起讨论,会持续更新

相关推荐
Hgfdsaqwr3 小时前
Django全栈开发入门:构建一个博客系统
jvm·数据库·python
开发者小天3 小时前
python中For Loop的用法
java·服务器·python
老百姓懂点AI4 小时前
[RAG实战] 向量数据库选型与优化:智能体来了(西南总部)AI agent指挥官的长短期记忆架构设计
python
喵手6 小时前
Python爬虫零基础入门【第九章:实战项目教学·第15节】搜索页采集:关键词队列 + 结果去重 + 反爬友好策略!
爬虫·python·爬虫实战·python爬虫工程化实战·零基础python爬虫教学·搜索页采集·关键词队列
Suchadar6 小时前
if判断语句——Python
开发语言·python
ʚB҉L҉A҉C҉K҉.҉基҉德҉^҉大6 小时前
自动化机器学习(AutoML)库TPOT使用指南
jvm·数据库·python
喵手6 小时前
Python爬虫零基础入门【第九章:实战项目教学·第14节】表格型页面采集:多列、多行、跨页(通用表格解析)!
爬虫·python·python爬虫实战·python爬虫工程化实战·python爬虫零基础入门·表格型页面采集·通用表格解析
0思必得07 小时前
[Web自动化] 爬虫之API请求
前端·爬虫·python·selenium·自动化
莫问前路漫漫7 小时前
WinMerge v2.16.41 中文绿色版深度解析:文件对比与合并的全能工具
java·开发语言·python·jdk·ai编程
木头左7 小时前
Backtrader框架下的指数期权备兑策略资金管理实现与风险控制
python