Python基础教程(十六):正则表达式

💝💝💝首先,欢迎各位来到我的博客,很高兴能够在这里和您见面!希望您在这里不仅可以有所收获,同时也能感受到一份轻松欢乐的氛围,祝你生活愉快!

💝💝💝如有需要请大家订阅我的专栏【Python系列】哟!我会定期更新相关系列的文章
💝💝💝关注!关注!!请关注!!!请大家关注下博主,您的支持是我不断创作的最大动力!!!

文章目录

引言

正则表达式是处理字符串的强大工具,尤其在数据清洗、文本解析和模式匹配等场景中发挥着重要作用。Python 提供了 re 模块来支持正则表达式的使用,本文将带你深入了解 Python 中的正则表达式,从基本语法到高级用法,结合实际案例,让你成为正则表达式的高手。

一、正则表达式基础

正则表达式由普通字符(如字母 a-z)和特殊字符(称为元字符)组成。元字符在正则表达式中具有特殊含义,它们可以表示一个字符集、一个位置等。下面是一些常用的元字符:

.:匹配任意除换行符以外的字符。

*:匹配前面的子表达式零次或多次。

+:匹配前面的子表达式一次或多次。

?:匹配前面的子表达式零次或一次。

^:匹配输入字符串的开始位置。

$:匹配输入字符串的结束位置。

[...]:字符集,匹配方括号中的任意字符。

[^...]:否定字符集,匹配任何不在方括号中的字符。

|:或,匹配 | 左右的表达式任意一个。

(...):分组,将多个字符当做一个整体进行匹配。

  • 元字符 :如 . 匹配任意单个字符,* 表示前面的元素可以出现任意次,包括0次。
  • 字符集[abc] 匹配 'a' 或 'b' 或 'c'。
  • 位置锚点^ 匹配行的开始,$ 匹配行的结束。

二、Python re 模块常用方法

  1. re.search(pattern, string):扫描整个字符串并返回第一个成功的匹配。
  2. re.match(pattern, string):尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功,则返回 None。
  3. re.findall(pattern, string):查找字符串中所有匹配正则表达式的子串,并返回一个列表。
  4. re.finditer(pattern, string) :类似于 findall,但返回的是一个迭代器,每次迭代返回一个 Match 对象。
  5. re.sub(pattern, repl, string):将字符串中所有匹配正则表达式的子串替换为指定字符串。

参数说明:

  • pattern 匹配的正则表达式
  • string 要匹配的字符串。
  • flags 标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。参见:正则表达式修饰符 - 可选标志

三、经典案例展示

案例 1:验证电子邮件地址
python 复制代码
import re

email_pattern = r"[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}"
email = "example@example.com"

if re.match(email_pattern, email):
    print("Valid email")
else:
    print("Invalid email")

此案例中,我们定义了一个电子邮件的正则表达式,然后使用 re.match 方法来验证给定的电子邮件地址是否符合预期的格式。

案例 2:获取电话号码
python 复制代码
phone_text = "Call me at 555-1234 or 555-6789."
phone_pattern = r"\d{3}-\d{4}"

matches = re.findall(phone_pattern, phone_text)
for match in matches:
    print(match)

这段代码会输出电话号码列表,即 ['555-1234', '555-6789']

案例 3:替换敏感词
python 复制代码
text = "Bad words should be filtered out. Bad!"
bad_word_pattern = r"Bad"

# 使用空字符串替换
clean_text = re.sub(bad_word_pattern, "", text)
print(clean_text)

# 或者替换为其他字符串
clean_text = re.sub(bad_word_pattern, "Good", text)
print(clean_text)

在这个例子中,我们使用 re.sub 方法来替换文本中的敏感词。

四、进阶用法

  • 分组和引用(...) 可以用来捕获括号内的匹配结果,之后可以通过 \1, \2, ... 来引用这些组。
  • 贪婪与非贪婪匹配 :默认情况下,*, +, {n,m} 是贪婪的,会尽可能多的匹配。添加 ? 变成非贪婪,即尽可能少的匹配。
  • 转义字符 :在正则表达式中,某些字符具有特殊含义,如果想将其视为普通字符,需要使用 \ 进行转义。

五、总结

正则表达式是处理文本的强大武器,而 Python 的 re 模块提供了丰富的功能来支持正则表达式的应用。通过本文的学习,你已经掌握了正则表达式的使用方法,以及如何在 Python 中实现文本匹配、提取和替换。继续练习和探索,你将能够更熟练地运用正则表达式解决实际问题。


结束语

喜欢博主的同学,请给博主一丢丢打赏吧↓↓↓您的支持是我不断创作的最大动力哟!感谢您的支持哦😘😘😘

💝💝💝如有需要请大家订阅我的专栏【Python系列】哟!我会定期更新相关系列的文章
💝💝💝关注!关注!!请关注!!!请大家关注下博主,您的支持是我不断创作的最大动力!!!

python相关文章索引 文章链接
Python基础语法(一):标识符与保留字部分 Python基础语法(一):标识符与保留字部分
Python基础语法(二):数据类型 Python基础语法(二):数据类型
Python基础语法(三):运算符 Python基础语法(三):运算符
Python基础语法(四):条件控制 Python基础语法(四):条件控制
Python基础语法(五):循环语句 Python基础语法(五):循环语句
Python基础语法(六):推导式编程 Python基础语法(六):推导式编程
Python基础教程(七):函数编程-从基础到进阶 Python基础教程(七):函数编程-从基础到进阶
Python基础教程(八):迭代器与生成器编程 Python基础教程(八):迭代器与生成器编程
Python基础教程(九):Lambda 函数 Python基础教程(九):Lambda 函数
Python基础教程(十):装饰器 Python基础教程(十):装饰器
Python基础教程(十一):数据结构汇总梳理 Python基础教程(十一):数据结构汇总梳理
Python基础教程(十二):模块 Python基础教程(十二):模块
Python基础教程(十三):file文件及相关的函数 Python基础教程(十三):file文件及相关的函数
Python基础教程(十四):OS 文件/目录方法 Python基础教程(十四):OS 文件/目录方法
Python基础教程(十五):面向对象编程 Python基础教程(十五):面向对象编程

❤️❤️❤️觉得有用的话点个赞 👍🏻 呗。
❤️❤️❤️本人水平有限,如有纰漏,欢迎各位大佬评论批评指正!😄😄😄
💘💘💘如果觉得这篇文对你有帮助的话,也请给个点赞、收藏下吧,非常感谢!👍 👍 👍
🔥🔥🔥Stay Hungry Stay Foolish 道阻且长,行则将至,让我们一起加油吧!🌙🌙🌙

相关推荐
0zxm8 分钟前
06 - Django 视图view
网络·后端·python·django
Hello.Reader9 分钟前
Redis热点数据管理全解析:从MySQL同步到高效缓存的完整解决方案
redis·mysql·缓存
是程序喵呀40 分钟前
MySQL备份
android·mysql·adb
指尖上跳动的旋律1 小时前
shell脚本定义特殊字符导致执行mysql文件错误的问题
数据库·mysql
ROBOT玲玉1 小时前
Milvus 中,FieldSchema 的 dim 参数和索引参数中的 “nlist“ 的区别
python·机器学习·numpy
Kai HVZ2 小时前
python爬虫----爬取视频实战
爬虫·python·音视频
古希腊掌管学习的神2 小时前
[LeetCode-Python版]相向双指针——611. 有效三角形的个数
开发语言·python·leetcode
m0_748244832 小时前
StarRocks 排查单副本表
大数据·数据库·python
B站计算机毕业设计超人2 小时前
计算机毕业设计PySpark+Hadoop中国城市交通分析与预测 Python交通预测 Python交通可视化 客流量预测 交通大数据 机器学习 深度学习
大数据·人工智能·爬虫·python·机器学习·课程设计·数据可视化
路人甲ing..2 小时前
jupyter切换内核方法配置问题总结
chrome·python·jupyter