java 正则表达式 所有的优先级

Java正则表达式的优先级从高到低如下:

正则表达式运算符优先级表

优先级 运算符 描述 示例
1 \ 转义符 \\. 匹配点号
2 (), (?:), (?=), (?!) 分组和断言 (abc), (?:abc), a(?=b)
3 *, +, ?, {n}, {n,}, {n,m} 量词 a+, b{3}, c{2,5}
4 字符序列 字符连接 abc 表示 a 后跟 b 后跟 c
5 ^, $, \b, \B 锚点 ^start, end$
6 ` ` 或运算

详细说明和示例

1. 转义符 \ (最高优先级)

java 复制代码
String regex = "a\\.b";  // 匹配 "a.b",而不是 "a" + 任意字符 + "b"

2. 分组和断言

java 复制代码
// 捕获分组
String regex1 = "(ab)+";     // 匹配 "ab", "abab", "ababab" 等

// 非捕获分组  
String regex2 = "(?:ab)+";   // 匹配但不捕获

// 正向先行断言
String regex3 = "a(?=b)";    // 匹配后面跟着b的a

// 负向先行断言
String regex4 = "a(?!b)";    // 匹配后面不跟b的a

3. 量词

java 复制代码
String regex1 = "ab?c";      // 匹配 "ac" 或 "abc" (b出现0或1次)
String regex2 = "a+b";       // 匹配 "ab", "aab", "aaab" 等 (a出现1次以上)
String regex3 = "a*b";       // 匹配 "b", "ab", "aab" 等 (a出现0次以上)
String regex4 = "a{2,4}";    // 匹配 "aa", "aaa", "aaaa"

4. 字符序列 (隐式连接)

java 复制代码
String regex = "abc";        // 匹配 "abc",优先级高于 |

5. 锚点

java 复制代码
String regex1 = "^abc";      // 匹配以abc开头的字符串
String regex2 = "abc$";      // 匹配以abc结尾的字符串
String regex3 = "\\bword\\b"; // 匹配完整的单词"word"

6. 或运算 | (最低优先级)

java 复制代码
String regex = "cat|dog";    // 匹配 "cat" 或 "dog"

优先级验证示例

java 复制代码
public class RegexPrecedence {
    public static void main(String[] args) {
        // 示例1:量词优先于 |
        String regex1 = "ab|cd+";    // 解析为: "ab" 或 "c" + "d"的一次或多次
        System.out.println("ab|cd+ 匹配:");
        System.out.println("ab: " + "ab".matches(regex1));    // true
        System.out.println("cd: " + "cd".matches(regex1));    // true  
        System.out.println("cdd: " + "cdd".matches(regex1));  // true
        System.out.println("abc: " + "abc".matches(regex1));  // false
        
        // 示例2:分组改变优先级
        String regex2 = "(ab|cd)+";  // 解析为: "ab"或"cd"的一次或多次
        System.out.println("\n(ab|cd)+ 匹配:");
        System.out.println("ab: " + "ab".matches(regex2));    // true
        System.out.println("abcd: " + "abcd".matches(regex2)); // true
        System.out.println("abab: " + "abab".matches(regex2)); // true
        
        // 示例3:字符连接优先于 |
        String regex3 = "^ab|cd$";   // 解析为: (以ab开头) 或 (以cd结尾)
        System.out.println("\n^ab|cd$ 匹配:");
        System.out.println("abc: " + "abc".matches(regex3));  // true
        System.out.println("xcd: " + "xcd".matches(regex3));  // true
        System.out.println("abcd: " + "abcd".matches(regex3)); // true
    }
}

常见优先级陷阱

java 复制代码
// 陷阱1:量词的作用范围
String trap1 = "ab+";    // 匹配 "ab", "abb", "abbb" (只对b量化)
String correct1 = "(ab)+"; // 匹配 "ab", "abab", "ababab" (对ab组量化)

// 陷阱2:| 的范围
String trap2 = "^ab|cd$";    // (^ab) 或 (cd$)
String correct2 = "^(ab|cd)$"; // 以ab或cd开头和结尾

// 陷阱3:断言的范围  
String trap3 = "a(?=b|c)d";  // a后面跟着b或c,然后是d
String correct3 = "a(?=b|cd)e"; // a后面跟着b或cd,然后是e

理解这些优先级规则对于编写正确的正则表达式至关重要,特别是当表达式包含多个操作符时。

相关推荐
JMzz3 小时前
Rust 中的数据结构选择与性能影响:从算法复杂度到硬件特性 [特殊字符]
开发语言·数据结构·后端·算法·性能优化·rust
风一样的美狼子4 小时前
仓颉语言核心数据结构-高性能与类型安全的工程实践
java·服务器·前端
钟离墨笺4 小时前
Go语言-->sync.WaitGroup 详细解释
开发语言·后端·golang
جيون داد ناالام ميづ4 小时前
Spring事务原理探索
java·后端·spring
小L~~~4 小时前
Python打造美观的桌面温馨提醒弹窗
开发语言·python
汤姆yu4 小时前
基于python大数据的特产推荐系统
大数据·开发语言·python
四念处茫茫4 小时前
仓颉技术:FFI外部函数接口
开发语言·后端·仓颉技术
Python私教4 小时前
深入理解 Java 分支语句:从基础到最佳实践
java·后端
艾菜籽4 小时前
MyBatis动态sql与留言墙联系
java·数据库·sql·spring·mybatis