Python---正则表达式

正则表达式 :使用re模块,基于re模块中的三个基础方法来做正则匹配,分别是:match, search, findall​​​​​​​

当字符串以r前缀开始时,Python将不会对字符串中的转义字符进行转义处理

re.match(匹配规则,被匹配字符串)

从被匹配字符串开头进行匹配,匹配成功返回匹配对象(包含匹配的信息),匹配不成功返回空

python 复制代码
import re
# 从头开始匹配
s = "abc bac bca cab cba"
result = re.match("abc", s)
print(result)  # <re.Match object; span=(0, 3), match='abc'>
print(result.span())  # (0, 3)
print(result.group())  # abc

result1 = re.match("bac", s)
print(result1)  # None
# print(result1.span())  # 会报错
# print(result1.group())  # 会报错

search(匹配规则,被匹配字符串)

搜索整个字符串,找出匹配的.从前向后,找到第一个就停止,不会继续向后查找

python 复制代码
import re

s = "sd999abc999sdabc"
result = re.search("abc", s)
print(result)  # <re.Match object; span=(5, 8), match='abc'>
print(result.span())  # (5, 8)
print(result.group())  # abc

result1 = re.search("qw", s)
print(result1)  # None
# print(result1.span())  # 会报错
# print(result1.group())  # 会报错

findall(匹配规则,被匹配字符串)

匹配整个字符串,找出全部匹配项

python 复制代码
import re

s = "sd999abc999sdabc"
result = re.findall("abc", s)
print(result)  # ['abc', 'abc']

单字符匹配

. :匹配任意一个字符串(除了\n), \.匹配点本身

\] : 匹配\[\]中列举的字符 \\d : 匹配数字, 即0 - 9 \\D : 匹配非数字 \\s : 匹配空白, 即空格和tab键 \\S : 匹配非空白 \\w : 匹配单词字符, 即a - z, A - Z, 0 - 9, _ \\W : 匹配非单词字符 ```python import re s = "hello @@hiHI !!999 ##hahaHA 456" # 找出全部数字 result = re.findall(r"\d", s) # 当字符串以r前缀开始时,Python将不会对字符串中的转义字符进行转义处理 print(result) # ['9', '9', '9', '4', '5', '6'] # 找出全部非单词字符 result1 = re.findall(r"\W", s) print(result1) # [' ', '@', '@', ' ', '!', '!', ' ', '#', '#', ' '] # 找出全部单词字符 result2 = re.findall(r"\w", s) print( result2) # ['h', 'e', 'l', 'l', 'o', 'h', 'i', 'H', 'I', '9', '9', '9', 'h', 'a', 'h', 'a', 'H', 'A', '4', '5', '6'] # 找出全部a-z和A-Z的的字母 result3 = re.findall(r"[a-zA-Z]", s) print(result3) # ['h', 'e', 'l', 'l', 'o', 'h', 'i', 'H', 'I', 'h', 'a', 'h', 'a', 'H', 'A'] result4 = re.findall(r"[a-z]", s) print(result4) # ['h', 'e', 'l', 'l', 'o', 'h', 'i', 'h', 'a', 'h', 'a'] ``` #### 数量匹配 \* : 匹配前一个规则的字符出现0至无数次 + : 匹配前一个规则的字符出现1至无数次 ? : 匹配前一个规则的字符出现0至1次 {m} : 匹配前一个规则的字符出现m次 {m,} : 匹配前一个规则的字符最少出现m次 {m,n} : 匹配前一个规则的字符出现m到n次 #### 边界匹配 \^ : 匹配字符串开头 $ : 匹配字符串结尾 \\b : 匹配一个单词的边界 \\B : 匹配非单词边界 #### 分组匹配 \| : 匹配左右任意一个表达 () : 将括号中的字符作为一个分组 ```python # 匹配账号:只能有字母和数字组成,长度限制6-10位 r = "^[0-9a-zA-Z]{6,10}$" s = '1234567' s1 = '1234567a' s2 = '1234567a_' print(re.findall(r, s)) # ['1234567'] print(re.findall(r, s1)) # ['1234567a'] print(re.findall(r, s2)) # [] # 匹配QQ号:纯数字,长度5-11,第一位不为0 r1 = "^[1-9][0-9]{4,10}$" q = "0123456" q1 = "123456" print(re.findall(r1, q)) # [] print(re.findall(r1, q1)) # ['123456'] # 匹配邮箱地址:只允许q,163,gmail这三种邮箱地址 # {内容}.{内容}.@{内容} r2 = "(^[\w-]+(\.[\w-]+)*@(qq|163|gmail)(\.[\w-]+)+$)" e = "[email protected]" e1 = "[email protected]" print(re.findall(r2, e)) # [('[email protected]', '.qwe', '163', '.c')] print(re.match(r2, e)) # print(re.match(r2, e1)) # None ```

相关推荐
不争先.1 分钟前
Pycharm&&Flask 学习心得:路由(3-4)
后端·python·flask
aiweker7 分钟前
python web flask专题-Flask入门指南:从安装到核心功能详解
前端·python·flask
一个天蝎座 白勺 程序猿15 分钟前
Python爬虫(35)Python爬虫高阶:基于Docker集群的动态页面自动化采集系统实战
爬虫·python·docker
伍贰什丿19 分钟前
python学习day2:运算符+优先级
开发语言·python·学习
KerwinChou_CN33 分钟前
自由开发者计划 001:创建一个用于查看 Jupyter Notebook 的谷歌浏览器插件 Jupyter Peek
ide·python·jupyter·plotly·scikit-learn
fictionist42 分钟前
正则表达式篇
linux·运维·服务器·数据库·mysql·正则表达式·c#
孙克旭_1 小时前
day019-特殊符号、正则表达式与三剑客
linux·运维·正则表达式
明月与玄武1 小时前
8 种快速易用的Python Matplotlib数据可视化方法
python·信息可视化·matplotlib
伍贰什丿1 小时前
python学习day2:进制+码制+逻辑运算符
python·学习
那雨倾城1 小时前
使用 OpenCV 实现“随机镜面墙”——多镜片密铺的哈哈镜效果
人工智能·python·opencv·计算机视觉