正则表达式检测网站regex101: build, test, and debug regex
#encoding=utf-8
import re
content="苹果是绿色的橙子是橙色的香蕉是黄色的乌鸦是黑色的"
p=re.compile(r'.色')
for one in p.findall(content):
print(one)
data:image/s3,"s3://crabby-images/83a49/83a4967d4e2aff7910519104673d34b8698324a5" alt=""
"."匹配任意字符(一个)
"*"匹配任意个字符包括0个和任意个
#encoding=utf-8
import re
content=("苹果是,绿色的\n"
"橙子是,橙色的\n"
"香蕉是,黄色的\n"
"乌鸦是,黑色的\n")
p=re.compile(r',.*')
for one in p.findall(content):
print(one)
data:image/s3,"s3://crabby-images/4b5f1/4b5f13c9d30fc633ab1b40ae6b226a81941a2b28" alt=""
data:image/s3,"s3://crabby-images/9022a/9022a9d0afb34e2342b2c7cfcbfd85232c62da7d" alt=""
"+"匹配至少1词
data:image/s3,"s3://crabby-images/5a88b/5a88b79f0f723e138a6248956f83555e672b26f7" alt=""
"{6}"重复6次
\d:任意数字
\D:非数字
\s:空字符,如[\t\n\r\f\v]
\S:非空字符[^\t\n\r\f\v]
\w:任意文字字符=[a-zA-Z0-9_]
\W:非文字字符=[^a-zA-Z0-9_]
[12]匹配1或2
[^]表示非
^表示匹配文本的起始位置
单行模式:表示匹配整个文本的开头位置
多行模式:表示匹配文本每行的开头位置
#encoding=utf-8
import re
content="""001-苹果价格-60,
002-橙子价格-70,
003-香蕉价格-80,
"""
import re
p=re.compile(r'^\d+')
print(p.findall(content))
data:image/s3,"s3://crabby-images/6ec6f/6ec6f0f760434cd786093dec6b71d9bff66f8472" alt=""
多行模式:表示匹配文本每行的开头位置
python
#encoding=utf-8
import re
content="""001-苹果价格-60,
002-橙子价格-70,
003-香蕉价格-80,
"""
import re
p=re.compile(r'^\d+',re.MULTILINE)
print(p.findall(content))
data:image/s3,"s3://crabby-images/0d37e/0d37e994c40cf4ffdd3d4bf8c1834fd1eee47cd9" alt=""
"$"表示文本的结束位置
如果是单行模式,表示这个文本的结束位置
如果是多行模式,表示文本每行的结束位置
python
#encoding=utf-8
import re
content="""001-苹果价格-60,
002-橙子价格-70,
003-香蕉价格-80,"""
import re
p=re.compile(r'\d+,$',re.MULTILINE)
print(p.findall(content))
data:image/s3,"s3://crabby-images/7030f/7030f813cf022d2c5e59f8c9a0776a75e8e24da9" alt=""
"?"取消贪婪模式
匹配模式替换:
#encoding=utf-8
import re
content="""001-苹果价格-60,
002-橙子价格-70,
003-香蕉价格-80,"""
import re
names="关羽;张飞,赵云, 马超,黄忠, 李逵"
p=re.split(r'[;,\s]\s*',names)
print(p)
names='''<a href='https://www.bilibili.com.vieo/av23456543/?p=1'target="_blank">点击这里,这边看视屏</a>
<a href='https://www.bilibili.com.vieo/av23342445/?p=1'target="_blank">点击这里,这边看视屏</a>
<a href='https://www.bilibili.com.vieo/av23486573/?p=1'target="_blank">点击这里,这边看视屏</a>
'''
#替换函数,参数对象是match
def subfun(match):
#Match对象的group(0)返回的是整个匹配上的字符串
src=match.group(0)
#March对象的group(1)返回的是第一个group分组的内容
number=int(match.group(1))+6
dest=(f'/av{number}/')
print(f'{src}替换为{dest}')
return dest
newStr=re.sub(r'/av(\d+?)/',subfun,names)
print(newStr)
data:image/s3,"s3://crabby-images/b03e4/b03e4daaf7ce8f3184fd6927053635e4b95c8dd6" alt=""