正则表达式

Regular Expression 正则表达式,一种使用表达式的方式对字符串进行匹配的语法规则.

我们抓取到的网页源代码本质上就是一个超长的字符串,想从里面提取内容.用正则再合适不过了

正则的优点: 速度快,效率高,准确性高

正则的缺点: 新手上手难度有点儿高.

不过只要掌握了正则编写的逻辑关系,写出一个提取页面内容的正则其实并不复杂

正则的语法:使用元字符进行排列组合用来匹配字符串 在线测试正则表达式在线正则表达式测试

元字符: 具有固定含义的特殊符号

常用元字符:

复制代码
.             匹配除换行符以外的任意字符
\w            匹配字母或数字或下划线
\s            匹配任意的空白符
\d            匹配数字
\n            匹配一个换行符
\t            匹配一个制表符
^             匹配字符串的开始
$             匹配字符串的结尾
\W            匹配非字母或数字或下划线
\D            匹配非数字
\S            匹配非空白符
a|b           匹配字符a或字符b
()            匹配括号内的表达式,也表示一个组
[...]         匹配字符组中的字符
[^...]        匹配除了字符组中字符的所有字符

量词:控制前面的元字符出现的次数

复制代码
*     重复零次或更多次
+     重复一次或更多次
?     重复零次或一次
{n}   重复n次
{n,}  重复n次或更多次
{n,m} 重复n到m次

贪婪匹配和惰性匹配

复制代码
.*        贪婪匹配
.*?       惰性匹配

举个例子

字符串abcdbcd

两个正则表达式

reg1 = 'a.*d' reg2 = 'a.*?d'

.*会找到最后一个d,而.*?只会找到第一个d

相关推荐
小美哥131419 小时前
Linux中find 命令的高级用法 组合条件 与、或、非(-a、-o、!) 以及通过 -regex 和 -iregex 选项使用正则表达式
linux·运维·服务器·正则表达式·云计算·bash
韶瑜不会写代码2 天前
7-14 利用正则表达式得到一段HTML文本中所有超链接对应的网址
python·正则表达式·html
ThisIsClark2 天前
【玩转正则表达式】Python、Go、Java正则表达式解释器的差异解析(附示例)
java·python·golang·正则表达式
New_Teen2 天前
正则表达式小结
linux·笔记·学习·正则表达式
柒七爱吃麻辣烫3 天前
正则表达式的基本应用以及查询工具
正则表达式
BirdMan983 天前
Flask-WTForms表单验证中常见的正则表达式
python·正则表达式·flask
MrZWCui5 天前
iOS OC使用正则表达式去除特殊符号并加粗文本,适用于接入AI大模型的流模式数据的文字处理
学习·ios·正则表达式·objective-c·xcode
chairon5 天前
Ansible相关工具:ansible-doc、ansible
linux·运维·服务器·正则表达式·ansible
Cloud_.6 天前
java-正则表达式
java·开发语言·正则表达式
木人舟7 天前
正则表达式快速入门
正则表达式