正则表达式 贪婪与非贪婪匹配

目录

  • [一. 回顾](#一. 回顾)
  • [二. 遇到的问题](#二. 遇到的问题)
  • [三. 分析](#三. 分析)
  • [四. 解决](#四. 解决)
    • [4.1 转换为非贪婪模式匹配](#4.1 转换为非贪婪模式匹配)
    • [4.2 提高匹配的精度](#4.2 提高匹配的精度)

一. 回顾

我们在正则表达式 分组与非捕获组这篇文章中,有如下分组匹配案例

html 复制代码
<select name="fruit_console">
	<option value="apple" selected>苹果</option>
	<option value="banana">香蕉</option>
	<option value="orange">橘子</option>
	<option value="none"></option>
</select>

<option value="(\w+)"(?:\s+selected)?>(.+)<\/option>

  • 我们使用上述正则表达式分组匹配了option元素中的value和文本

二. 遇到的问题

😵如果option元素都在同一行的话,继续使用之前的正则表达式

<option value="(\w+)"(?:\s+selected)?>(.+)<\/option>

进行匹配的话

html 复制代码
<select name="fruit_console">
	<option value="apple" selected>苹果</option><option value="banana">香蕉</option><option value="orange">橘子</option><option value="none"></option>
</select>

😒就会遇到下面的问题

  • apple是我们预期的匹配值
  • 但是匹配到苹果之后,还继续向后匹配到了很多预期外的数据
  • 预想的是匹配3组数据,但是实际只匹配到1组,而且匹配失败

三. 分析

⏹正则表达式有两种模式

  • 贪婪模式:尽可能的多匹配文本
    • 正则表达式默认情况下是贪婪模式
    • *+{} 都默认贪婪匹配
  • 非贪婪模式:会尽可能少的匹配文本
    • 在量词后面加上 ? 就可以转换为非贪婪匹配

⭐我们使用下面的正则表达式

<option value="(\w+)"(?:\s+selected)?>(.+)<\/option>

⭐匹配下面的HTML的时候

html 复制代码
<option value="apple" selected>苹果</option><option value="banana">香蕉</option><option value="orange">橘子</option><option value="none"></option>

🤔当(.+)进行匹配的时候,由于html都在一行,当匹配到苹果的时候,由于苹果后面还有符合条件的文本,于是贪婪模式的(.+)会继续向后匹配,直到匹配到最后。


四. 解决

4.1 转换为非贪婪模式匹配

<option value="(\w+)"(?: selected)?>(.+?)<\/option>

  • 通过添加?,将贪婪的.+转换为非贪婪的.+?
  • 在非贪婪匹配模式下,(.+?)匹配到苹果之后,就不会继续向后匹配了

4.2 提高匹配的精度

<option value="(\w+)"(?: selected)?>([^<]+)<\/option>

  • [^<]+:匹配除了<之外的所有内容
  • 也就是说当匹配到>苹果<的时候,由于苹果的后面有一个<,因此就只会匹配到苹果,不会继续向后匹配
  • 从而完成了精确匹配
相关推荐
长城20242 天前
HTML5中表单的pattern属性解析
前端·正则表达式·html·html5·pattern·pattern属性·pattern正则表达式
Gss7772 天前
Linux 正则表达式详解(基础 + 扩展 + 实操)
linux·运维·正则表达式
黑客思维者2 天前
正则表达式(九)网络安全:检测SQL注入攻击 + 检测XSS跨站脚本 + 扫描敏感信息泄露 + 匹配暴力破解异常IP
sql·web安全·正则表达式
黎雁·泠崖2 天前
Java常用类核心详解(七):正则表达式 Regex 从入门到实战
java·开发语言·正则表达式
秀儿还能再秀2 天前
正则表达式核心语法 + Python的 re 库中常用方法
python·正则表达式
xcLeigh2 天前
Python入门:Python3 正则表达式全面学习教程
python·学习·正则表达式·教程·python3
数据知道3 天前
MongoDB 正则表达式查询:在 MongoDB 中实现模糊搜索与索引优化陷阱
数据库·mongodb·正则表达式
A懿轩A3 天前
【Java 基础编程】Java 正则表达式实战:Pattern/Matcher、元字符与常用正则,验证与提取必备
java·开发语言·正则表达式
石牌桥网管3 天前
正则表达式:匹配不包含指定字符串的文本
java·javascript·python·正则表达式·go·php