正则表达式新解

文章目录

是什么?

正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符"),可以用来描述和匹配字符串的特定模式。

正则表达式是一种用于模式匹配和搜索文本的工具。

正则表达式提供了一种灵活且强大的方式来查找、替换、验证和提取文本数据。

正则表达式可以应用于各种编程语言和文本处理工具中,如 JavaScript、Python、Java、Perl 等。

也就是说,正则表达式是用来筛选信息的工具,用于匹配查找替换等操作,它是一串特殊字符的集合。正则表达式用来匹配有相似特征的字符串

#为什么要用正则表达?

就是在表单验证时,准确的判断一个字符串是不是某种固定格式。比如邮箱的验证、手机号的验证等。目的是避免恶意用户的乱输入,使表单的收集是我们想要的格式!

想象一下,您正在编写应用程序,并且您希望在用户选择用户名时设置规则。我们希望用户名可以包含字母,数字,下划线和连字符。

为了让它看起来不丑,我们还想限制用户名中的字符数量。这时我们可以使用正则表达式来验证用户名

也就是说,使用正则表达式的意义在于将数据转化为用户需要的格式,使信息更加形象表达,方便查找是否有恶意信息

正则用法

匹配单个字符

记号 说明
. 匹配任意单个字符(换行符除外). 表示真正的.
[...x-y...] 匹配字符集合里的任意单个字符
[^...x-y...] 匹配不在字符组里的任意单个字符
\d 匹配任意数字,与[0-9] 同义
\w 匹配任意数字、字母、下划线,与[0-9a-zA-Z_] 同义
\s 匹配空白字符,与[\r\v\f\t\n] 同义

匹配一组字符

记号 说明
字符串 匹配字符串值
字符串1|字符串2 匹配字符串1或字符串2
* 左邻第一个字符出现0 次或无穷次
+ 左邻第一个字符最少出现1 次或无穷次
? 左邻第一个字符出现0 次或1 次
{m,n} 左邻第一个字符出现最少m 次最多n 次

其他元字符

记号 说明
^ 匹配字符串的开始 集合取反
$ 匹配字符串的结尾
\b 匹配单词的边界,单词包括\w 中的内容
() 对字符串分组
\数字 匹配已保存的子组

核心函数

核心函数 说明
re.findall() 在字符串中查找正则表达式的所有(非覆盖)出现;返回一个匹配对象的列表。
re.match() 尝试用正则表达式模式从字符串的开头匹配 如果匹配成功,则返回一个匹配对象 否则返回None
re.search() 在字符串中查找正则表达式模式的第一次出现 如果匹配成,则返回一个匹配对象 否则返回None
re.group() 使用match 或者search 匹配成功后,返回的匹配对象 可以通过group() 方法获取得匹配内容
re.finditer() 和findall() 函数有相同的功能,但返回的不是列表而是迭代器 对于每个匹配,该迭代器返回一个匹配对象
re.split() 根据正则表达式中的分隔符把字符分割为一个列表,并返回成功匹配的列表字符串也有类似的方法,但是正则表达式更加灵活
re.sub() 把字符串中所有匹配正则表达式的地方换成新的字符串

贪婪匹配和非贪婪匹配

贪婪匹配:尽可能匹配多的字符

非贪婪匹配:尽可能匹配少的字符

如下面的代码,要匹配中间的数字,但是他的输出结果只有7,这是因为在贪婪匹配下,(\d+)前的.*会尽可能匹配多的字符,而(\d+)是匹配任意个数字,没有说具体几个数字,这样他就会匹配将llo 123456都匹配,只留一个数字给(\d+)匹配,这样(\d+)就只能匹配到7

复制代码
import re
 
s='hello 1234567 world'
res = re.match('he.*(\d+).*rld$',s)
 
print(res.group(1))

如果要输出1234567,就要将匹配变为非贪婪匹配,在.*后加一个?,匹配尽可能少的字符,这样一来,.*?匹配到llo后面的空格后就不再匹配,而是交给(\d+)匹配,这样就能匹配到1234567了:

复制代码
import re
 
s='hello 1234567 world'
res = re.match('he.*?(\d+).*rld$',s)
 
print(res.group(1))

正则练习

Python环境下引入re模块,定义一个字符串:

复制代码
>>> import re
>>> s="I say food not Good"

匹配ood字符串:

匹配出food,Good:

贪婪匹配:

非贪婪匹配:

用点和中括号匹配:

相关推荐
计算机学姐几秒前
基于SpringBoot的健身房管理系统【智能推荐算法+可视化统计】
java·vue.js·spring boot·后端·mysql·spring·推荐算法
我科绝伦(Huanhuan Zhou)27 分钟前
【免费】MySQL自动化巡检工具,一键生成WORD巡检报告
运维·mysql·自动化
一 乐36 分钟前
个人健康系统|健康管理|基于java+Android+微信小程序的个人健康系统设计与实现(源码+数据库+文档)
android·java·数据库·vue.js·spring boot·生活
q***239242 分钟前
【SQL技术】不同数据库引擎 SQL 优化方案剖析
数据库·sql
非得登录才能看吗?44 分钟前
正则表达式入门
正则表达式
老华带你飞1 小时前
医疗保健|医疗养老|基于Java+vue的医疗保健系统(源码+数据库+文档)
java·数据库·vue.js·spring boot·论文·毕设·医疗保健
小飞大王6661 小时前
JavaScript基础知识总结(四):常见内置构造函数,正则表达式,作用域与闭包
前端·javascript·正则表达式
Leon-Ning Liu2 小时前
Oracle 19C 数据字典 DBA_HIST_SEG_STAT 详细说明
数据库·oracle·dba
⑩-2 小时前
苍穹外卖Day(1)
java·数据库·spring boot·spring·java-ee·mybatis
朝新_2 小时前
【统一功能处理】从入门到源码:拦截器学习指南(含适配器模式深度解读)
数据库·后端·mybatis·适配器模式·javaee