正则表达式

正则表达式

1. 正则表达式概述

定义: 正则表达式是---套⽤于处理字符串的通⽤规则,在多种编程语⾔中通⽤,包括 C 、C++ 、Java 、JavaScript 、PHP 、Ruby等。
主要⽤途:
数据验证: 验证⽤户输⼊是否符合规范,例如⽤户名只能包含英⽂字⺟、数字和 下划线
数据提取: 从⼤量⽂本中快速提取特定格式的数据,如从⽹⻚中提取所有图⽚链 接
数据清洗: 处理从⽹络获取的数据,提取关键信息

跨语⾔特性: 正则表达式的语法规则在不同语⾔中基本相同,只是具体实现函数可能 不同

2. re模块操作

1)re模块的使⽤过程

导⼊模块: ⾸先需要导⼊Python的re模块,import re

匹配⽅法: 主要使⽤re.match()⽅法进⾏匹配

语法: result = re.match(正则表达式, 要匹配的字符串)

返回值: 如果匹配成功返回匹配对象,否则返回None

提取数据: 使⽤group()⽅法提取匹配到的数据

匹配原理: 正则表达式放在第---个参数,要处理的数据放在第⼆个参数
2)re模块示例

匹配过程:

从字符串开头开始匹配

如果匹配成功返回匹配对象

使⽤group()⽅法获取匹配结果

⼤⼩写匹配: 使⽤中括号[]可以匹配多个可能字符

二、正则表达式深入

1. re.match函数的使⽤

返回值意义:

有返回值表示匹配成功,数据符合规范

⽆返回值表示匹配失败,数据不符合规范

实际应⽤: 可以⽤来验证⽤户输⼊是否符合要求

正则表达式的返回值解释

匹配对象: 当正则表达式匹配成功时返回的对象

None: 当正则表达式匹配失败时返回的值

⼤⼩写敏感: 默认区分⼤⼩写,可以通过正则表达式规则处理

4. 正则表达式中的中括号⽤法

功能: 匹配括号内任意---个字符

Hh\]可以匹配⼤写H或⼩写h \[aeiou\]可以匹配任意---个元⾳字⺟ **5. 正则表达式的其他组成部分** **常⽤符号:** .: 匹配任意单个字符 \*: 匹配前---个字符0次或多次 +: 匹配前---个字符1次或多次 ?: 匹配前---个字符0次或1次 \|: 或运算符 (): 分组

相关推荐
九皇叔叔1 天前
Linux Shell 正则表达式中的 POSIX 字符集:用法与实战
linux·运维·正则表达式
m0_64880493_江哥2 天前
用正则方法从中英文本提取英文的python示例
python·mysql·正则表达式
九皇叔叔2 天前
Linux Shell 正则表达式:从入门到实战,玩转文本匹配与处理
linux·mysql·正则表达式
一百天成为python专家3 天前
python爬虫入门(小白五分钟从入门到精通)
开发语言·爬虫·python·opencv·yolo·计算机视觉·正则表达式
蓝桉~MLGT4 天前
Python学习历程——字符串相关操作及正则表达式
python·学习·正则表达式
一晌小贪欢4 天前
Python爬虫第5课:正则表达式与数据清洗技术
爬虫·python·正则表达式·网络爬虫·python爬虫·python3·网页爬虫
MANONGMN5 天前
Linux 通配符与正则表达式(含实战案例+避坑指南)
linux·运维·正则表达式
带土15 天前
18 .shell编程-正则表达式
linux·正则表达式
2025年一定要上岸6 天前
【日常学习】10-15 学习re
学习·算法·正则表达式
Penguin_zlh9 天前
基础 - 正则表达式
正则表达式