【JAVA】正则表达式的贪婪模式与非贪婪模式

白萝卜弟弟2024-11-11 23:23

在Java中，正则表达式可以使用两种不同的量词模式来匹配字符序列：贪婪模式（greedy）和非贪婪模式（reluctant或lazy）。

贪婪模式 (Greedy)

默认情况下，正则表达式的量词是贪婪的。这意味着当一个量词可以匹配多个字符时，它会尽可能多地匹配。例如：

* 匹配前面的元素零次或多次。
+ 匹配前面的元素一次或多次。
? 匹配前面的元素零次或一次。
{n,m} 匹配前面的元素至少n次，至多m次。

这些量词在没有其他限制的情况下，总是尝试匹配尽可能长的字符串。

示例

假设我们有一个字符串 "abcabcabc" 和正则表达式 a.*c，这里的 .* 是贪婪的，它会匹配从第一个 a 到最后一个 c 之间的所有字符，即整个字符串 "abcabcabc"。

非贪婪模式 (Reluctant or Lazy)

非贪婪模式则是与贪婪模式相反的行为。当使用非贪婪量词时，它们会尽可能少地匹配字符。为了使量词变为非贪婪模式，可以在量词后面加上一个问号 ?。

*? 匹配前面的元素零次或多次，但尽可能少。
+? 匹配前面的元素一次或多次，但尽可能少。
?? 匹配前面的元素零次或一次，但尽可能少。
{n,m}? 匹配前面的元素至少n次，至多m次，但尽可能少。

示例

如果使用相同的字符串 "abcabcabc" 但是正则表达式改为 a.*?c，这里的 .*? 是非贪婪的，它会匹配从第一个 a 开始到最近的一个 c 之间的所有字符，即第一次匹配结果为 "abc"，然后继续匹配下一段，直到所有的 "abc" 组合都被找到。

使用场景

贪婪模式 常用于需要获取最长可能匹配的情况。
非贪婪模式 常用于需要获取最短可能匹配的情况，特别是在处理HTML标签或其他需要精确控制匹配长度的文本时非常有用。

在编写正则表达式时，选择正确的模式对于确保你的程序能够正确解析目标文本是非常重要的。

上一篇：Java项目实战II基于微信小程序的实习记录（开发文档+数据库+源码）

下一篇：使用c#实现TCP客户端与服务器端

热门推荐

01如何新建文件夹？电脑新建文件夹的4种方法 02GitHub 镜像站点 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04AI科技热点日报 | 2026年07月01日 05国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 07幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？09微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 102026 年 AI 大模型 & AI 编程工具实战全总结