1、正则表达式

1、正则表达式是一种用于描述文本模式的工具。它是由字符和特殊符号组成的字符串,描述了模式的重复或者多个字符,于是就可以按照某种模式匹配一系列有相似特征的字符串。它主要的作用是将文本用某种可被计算机识别的模式表现出来,为高级的文本模式匹配、抽取、与/或 文本形式的搜索和替换功能提供了基础。

2、python中通过re模块支持正则表达式,主要包括以下用法:

1)匹配和搜索:re.match(pattern,string)

import re

result = re.match(r'\d+','123abc') #r表示原始字符串,\不代表转义,d表示单个数字(0~9),+表示可以是多个字符,正则表达式和字符串单引号和双引号都可以用。w+表示所有的数字和字符串。

print(result.group()) #输出'123'

2)替换 re.sub(pattern,repl,string) 用repl替换字符串中所有与pattern匹配的问题

result = re.sub(r'\d+', 'num','abc123def456')

print(result) #输出 'abcnumdefnum'

3)拆分 re.split(pattern, string) 根据正则表达式pattern拆分字符串

result = re.split(r"\d+", "abc123def456")

print(result) #输出['abc,' 'def', ' ']

4)、查找所有匹配项 re.findall(pattern, string)返回一个列表,包含字符串中所有与pattern匹配的部分

result = re.findall(r'\d+','abc123def456')

print(result) #输出['123', '456']

5)、匹配对象:re.match和search方法返回的对象可以提供以下信息:

group():返回匹配的字符串

groups():返回一个包含所有捕获组的元祖

start():匹配字符串的起始索引

end():匹配字符串的结束索引

span():返回一个元祖,包括匹配的开始和结束位置

3、搜索通常是指在字符串或数据中查找某个特定的值或模式。匹配通常是指检查数据是否符合某种模式或规则。

4、compile编译正则表达式会返回一个正则表达式对象。

用法:patten = re.compile(r'a.b')

patten.match('abcde125j');

5、元字符:

.: 匹配任何字符(除\n)。patten = re.compile(r'a.b')表示匹配任何字符。

^:匹配字符串开头部分。

pattern = re.compile(r'^Hello')

Hello, world!', 'Say Hello', 'Hello']

'Hello, world!' 匹配
'Say Hello' 不匹配
'Hello' 匹配

$:匹配字符串结尾部分。

pattern = re.compile(r'world!$')

'Hello, world!', 'world! Here I come', 'Hello, world'

'Hello, world!' 匹配
'world! Here I come' 不匹配
'Hello, world' 不匹配

?:匹配0次或1次前面出现的正则表达式

pattern = re.compile(r'a?')

'a' 匹配 'a'
'aa' 匹配 'a'
'aaa' 不匹配
'' 匹配 ''
'b' 不匹配

{N}匹配N次;{M,N}匹配M~N次;[...]匹配来自字符集的任意单一字符;

相关推荐
学步_技术1 分钟前
Python编码系列—Python抽象工厂模式:构建复杂对象家族的蓝图
开发语言·python·抽象工厂模式
Narutolxy35 分钟前
Python 单元测试:深入理解与实战应用20240919
python·单元测试·log4j
Amo Xiang1 小时前
2024 Python3.10 系统入门+进阶(十五):文件及目录操作
开发语言·python
liangbm31 小时前
数学建模笔记——动态规划
笔记·python·算法·数学建模·动态规划·背包问题·优化问题
B站计算机毕业设计超人1 小时前
计算机毕业设计Python+Flask微博情感分析 微博舆情预测 微博爬虫 微博大数据 舆情分析系统 大数据毕业设计 NLP文本分类 机器学习 深度学习 AI
爬虫·python·深度学习·算法·机器学习·自然语言处理·数据可视化
羊小猪~~1 小时前
深度学习基础案例5--VGG16人脸识别(体验学习的痛苦与乐趣)
人工智能·python·深度学习·学习·算法·机器学习·cnn
waterHBO3 小时前
python 爬虫 selenium 笔记
爬虫·python·selenium
编程零零七4 小时前
Python数据分析工具(三):pymssql的用法
开发语言·前端·数据库·python·oracle·数据分析·pymssql
AIAdvocate6 小时前
Pandas_数据结构详解
数据结构·python·pandas
小言从不摸鱼6 小时前
【AI大模型】ChatGPT模型原理介绍(下)
人工智能·python·深度学习·机器学习·自然语言处理·chatgpt