软件测试/测试开发丨Python 内置库 正则表达式

点此获取更多相关资料

本文为霍格沃兹测试开发学社学员学习笔记分享

原文链接:https://ceshiren.com/t/topic/27058

python 内置库 正则表达式

目录

  • 正则表达式
  • 使用re模块实现正则表达式操作

正则表达式

  • 正则表达式就是记录文本规则的代码
  • 可以查找操作符合某些复杂规则的字符串

在 python 中使用正则表达式

  • 把正则表达式作为模式字符串
  • 正则表达式可以使用原生字符串来表示
  • 原生字符串需要在字符串前方加上 r'string'

使用 re 模块实现正则表达式操作

正则表达式对象转换

  • compile():将字符串转换为正则表达式对象

  • 需要多次使用这个正则表达式的场景

python 复制代码
import  re
# 匹配包含abc的字符串
paten = r'abc'

# 转换为正则对象
parens = re.compile(paten)

匹配字符串

  • match():从字符串的开始处进行匹配
  • search():在整个字符串中搜索第一个匹配的值
  • findall():在整个字符串中搜索所有符合正则表达式的字符串,返回列表
python 复制代码
import  re
# 匹配包含abc的字符串
paten = r'abc\w+'

# 转换为正则对象
s1 = 'Abcskd = 123 is not right abcddd'

match1 = re.match(paten,s1,re.I)
print(f'match1={match1}') # 结果是:match1=<re.Match object; span=(0, 6), match='Abcskd'>
print(f'匹配值的起始位置是:{match1.start()}') # 结果是:匹配值的起始位置是:0
print(f'匹配值的结束位置是:{match1.end()}') # 结果是:匹配值的结束位置是:6
print(f'匹配位置的元组是:{match1.span()}') # 结果是:匹配位置的元组是:(0, 6)
print(f'要匹配的字符串是:{match1.string}') # 结果是:要匹配的字符串是:Abcskd = 123 is not right abcddd
print(f'匹配的数据是:{match1.group()}') # 结果是:匹配的数据是:Abcskd

s2 = 'hogwars is aBcfnjk over abcednjk'

match2 = re.search(paten,s2,re.I)
print(f'match2={match2}') # 结果是:match2=<re.Match object; span=(11, 18), match='aBcfnjk'>

match3 = re.findall(paten,s2,re.I)
print(f'match3={match3}') # 结果是:match3=['aBcfnjk', 'abcednjk']

替换字符串

  • sub():实现字符串替换
python 复制代码
import re

# 匹配手机号码
patten = r'1[3578]\d{9}'
s1 = '中奖号码是12352,联系电话是 13396541515'
resoult = re.sub(patten, '1**********', s1, re.I)

print(resoult) # 结果是:中奖号码是12352,联系电话是 1**********

分隔字符串

  • splite():根据正则表达式分隔字符串,返回列表
python 复制代码
import re

# 匹配url
url = 'https://www.baidu.com/s?wd=python%20%E6%96%87%E4%BB%B6%E9%87%8D%E5%91%BD%E5%90%8D&rsv_spt=1&rsv_iqid=0xab0b52ee000f18bf&issp=1&f=8&rsv_bp=1&rsv_idx=2&ie=utf-8&rqlang=cn&tn=baiduhome_pg&rsv_enter=1&rsv_dl=tb&oq=python%2520%25E8%258E%25B7%25E5%258F%2596%25E6%2597%25B6%25E9%2597%25B4%25E5%258E%25BB%25E6%258E%2589%25E6%25AF%25AB%25E7%25A7%2592&rsv_btype=t&inputT=746127&rsv_t=d404tftRITts23PDJ3BYWWHgHT%2B4lUTFKkarp1PmGdtY5VvsqaU1dOBq3b4ua5I5gfQy&rsv_pq=d30f8b1a0009347e&rsv_n=2&rsv_sug2=0&rsv_sug4=746127'

paten = r'[?|&]'

s = re.split(paten,url)
print(s)
'''
['https://www.baidu.com/s', 
 'wd=python%20%E6%96%87%E4%BB%B6%E9%87%8D%E5%91%BD%E5%90%8D',
 'rsv_spt=1', 'rsv_iqid=0xab0b52ee000f18bf', 'issp=1', 'f=8',
 'rsv_bp=1', 'rsv_idx=2', 'ie=utf-8', 'rqlang=cn', 
 'tn=baiduhome_pg', 'rsv_enter=1', 'rsv_dl=tb', 
 'oq=python%2520%25E8%258E%25B7%25E5%258F%2596%25E6%2597%25B6%25E9%2597%25B4%25E5%258E%25BB%25E6%258E%2589%25E6%25AF%25AB%25E7%25A7%2592',
 'rsv_btype=t', 'inputT=746127', 'rsv_t=d404tftRITts23PDJ3BYWWHgHT%2B4lUTFKkarp1PmGdtY5VvsqaU1dOBq3b4ua5I5gfQy', 
 'rsv_pq=d30f8b1a0009347e', 'rsv_n=2', 'rsv_sug2=0', 'rsv_sug4=746127']
'''
相关推荐
Tipriest_1 小时前
Python关键字梳理
python·关键字·keyword
im_AMBER2 小时前
学习日志05 python
python·学习
大虫小呓2 小时前
Python 处理 Excel 数据 pandas 和 openpyxl 哪家强?
python·pandas
哪 吒3 小时前
2025B卷 - 华为OD机试七日集训第5期 - 按算法分类,由易到难,循序渐进,玩转OD(Python/JS/C/C++)
python·算法·华为od·华为od机试·2025b卷
gnip3 小时前
总结一期正则表达式
javascript·正则表达式
摸爬滚打李上进4 小时前
重生学AI第十六集:线性层nn.Linear
人工智能·pytorch·python·神经网络·机器学习
凛铄linshuo5 小时前
爬虫简单实操2——以贴吧为例爬取“某吧”前10页的网页代码
爬虫·python·学习
牛客企业服务5 小时前
2025年AI面试推荐榜单,数字化招聘转型优选
人工智能·python·算法·面试·职场和发展·金融·求职招聘
胡斌附体5 小时前
linux测试端口是否可被外部访问
linux·运维·服务器·python·测试·端口测试·临时服务器
77qqqiqi5 小时前
正则表达式
java·后端·正则表达式