java 正则表达式 所有的优先级

Java正则表达式的优先级从高到低如下:

正则表达式运算符优先级表

优先级 运算符 描述 示例
1 \ 转义符 \\. 匹配点号
2 (), (?:), (?=), (?!) 分组和断言 (abc), (?:abc), a(?=b)
3 *, +, ?, {n}, {n,}, {n,m} 量词 a+, b{3}, c{2,5}
4 字符序列 字符连接 abc 表示 a 后跟 b 后跟 c
5 ^, $, \b, \B 锚点 ^start, end$
6 ` ` 或运算

详细说明和示例

1. 转义符 \ (最高优先级)

java 复制代码
String regex = "a\\.b";  // 匹配 "a.b",而不是 "a" + 任意字符 + "b"

2. 分组和断言

java 复制代码
// 捕获分组
String regex1 = "(ab)+";     // 匹配 "ab", "abab", "ababab" 等

// 非捕获分组  
String regex2 = "(?:ab)+";   // 匹配但不捕获

// 正向先行断言
String regex3 = "a(?=b)";    // 匹配后面跟着b的a

// 负向先行断言
String regex4 = "a(?!b)";    // 匹配后面不跟b的a

3. 量词

java 复制代码
String regex1 = "ab?c";      // 匹配 "ac" 或 "abc" (b出现0或1次)
String regex2 = "a+b";       // 匹配 "ab", "aab", "aaab" 等 (a出现1次以上)
String regex3 = "a*b";       // 匹配 "b", "ab", "aab" 等 (a出现0次以上)
String regex4 = "a{2,4}";    // 匹配 "aa", "aaa", "aaaa"

4. 字符序列 (隐式连接)

java 复制代码
String regex = "abc";        // 匹配 "abc",优先级高于 |

5. 锚点

java 复制代码
String regex1 = "^abc";      // 匹配以abc开头的字符串
String regex2 = "abc$";      // 匹配以abc结尾的字符串
String regex3 = "\\bword\\b"; // 匹配完整的单词"word"

6. 或运算 | (最低优先级)

java 复制代码
String regex = "cat|dog";    // 匹配 "cat" 或 "dog"

优先级验证示例

java 复制代码
public class RegexPrecedence {
    public static void main(String[] args) {
        // 示例1:量词优先于 |
        String regex1 = "ab|cd+";    // 解析为: "ab" 或 "c" + "d"的一次或多次
        System.out.println("ab|cd+ 匹配:");
        System.out.println("ab: " + "ab".matches(regex1));    // true
        System.out.println("cd: " + "cd".matches(regex1));    // true  
        System.out.println("cdd: " + "cdd".matches(regex1));  // true
        System.out.println("abc: " + "abc".matches(regex1));  // false
        
        // 示例2:分组改变优先级
        String regex2 = "(ab|cd)+";  // 解析为: "ab"或"cd"的一次或多次
        System.out.println("\n(ab|cd)+ 匹配:");
        System.out.println("ab: " + "ab".matches(regex2));    // true
        System.out.println("abcd: " + "abcd".matches(regex2)); // true
        System.out.println("abab: " + "abab".matches(regex2)); // true
        
        // 示例3:字符连接优先于 |
        String regex3 = "^ab|cd$";   // 解析为: (以ab开头) 或 (以cd结尾)
        System.out.println("\n^ab|cd$ 匹配:");
        System.out.println("abc: " + "abc".matches(regex3));  // true
        System.out.println("xcd: " + "xcd".matches(regex3));  // true
        System.out.println("abcd: " + "abcd".matches(regex3)); // true
    }
}

常见优先级陷阱

java 复制代码
// 陷阱1:量词的作用范围
String trap1 = "ab+";    // 匹配 "ab", "abb", "abbb" (只对b量化)
String correct1 = "(ab)+"; // 匹配 "ab", "abab", "ababab" (对ab组量化)

// 陷阱2:| 的范围
String trap2 = "^ab|cd$";    // (^ab) 或 (cd$)
String correct2 = "^(ab|cd)$"; // 以ab或cd开头和结尾

// 陷阱3:断言的范围  
String trap3 = "a(?=b|c)d";  // a后面跟着b或c,然后是d
String correct3 = "a(?=b|cd)e"; // a后面跟着b或cd,然后是e

理解这些优先级规则对于编写正确的正则表达式至关重要,特别是当表达式包含多个操作符时。

相关推荐
萧鼎33 分钟前
Python PyTesseract OCR :从基础到项目实战
开发语言·python·ocr
abments1 小时前
pgsql timestamp without time zone > character varying解决方案
java
二川bro1 小时前
第57节:Three.js企业级应用架构
开发语言·javascript·架构
sali-tec1 小时前
C# 基于halcon的视觉工作流-章62 点云采样
开发语言·图像处理·人工智能·算法·计算机视觉
sanggou2 小时前
大数据量查询处理方案 - 内存优化与高效展示
java
没有bug.的程序员2 小时前
Java 字节码:看懂 JVM 的“机器语言“
java·jvm·python·spring·微服务
-大头.2 小时前
深入理解 Java 内存区域与 JVM 运行机制
java·jvm
没有bug.的程序员2 小时前
JVM 整体架构:一套虚拟机的心脏与血管
java·jvm·spring boot·spring cloud·架构
晨枫阳2 小时前
不同语言的元组对比
java·前端·javascript
悟能不能悟2 小时前
怎么在idea合并2个个branch
java·ide·intellij-idea