java 正则表达式匹配Matcher 类

Matcher 类 用法

在 Java 中,Matcher 类是用于匹配正则表达式的工具,而 group() 方法是 Matcher 类中的一个重要方法,用于提取匹配结果中的捕获组(captured groups)。以下是对 group() 方法的详细解释:


1. 正则表达式中的捕获组

在正则表达式中,捕获组是通过圆括号 () 定义的。每个 () 内的子表达式都是一个捕获组,匹配的内容可以被单独提取。

例如:

复制代码
String regex = "(\\d{2})-(\\d{2})-(\\d{4})";

这个正则表达式匹配日期格式(如 12-31-2023),其中:

  • (\\d{2}) 是第一个捕获组,匹配月份。

  • (\\d{2}) 是第二个捕获组,匹配日期。

  • (\\d{4}) 是第三个捕获组,匹配年份。


2. Matcher 类的作用

Matcher 类用于对输入字符串进行正则表达式匹配。它通过 Pattern 类的 matcher() 方法创建。

示例:

复制代码
Pattern pattern = Pattern.compile("(\\d{2})-(\\d{2})-(\\d{4})");
Matcher matcher = pattern.matcher("12-31-2023");

3. group() 方法的作用

group() 方法用于提取匹配结果中的捕获组。它有几种重载形式:

(1) group()
  • 返回整个匹配的字符串。

  • 如果没有匹配成功,调用此方法会抛出 IllegalStateException

示例:

复制代码
if (matcher.find()) {
    System.out.println(matcher.group()); // 输出 "12-31-2023"
}
(2) group(int group)
  • 返回指定捕获组的匹配内容。

  • 捕获组的编号从 1 开始,group(0) 等价于 group(),表示整个匹配的字符串。

  • 如果指定的捕获组不存在,会抛出 IndexOutOfBoundsException

示例:

复制代码
if (matcher.find()) {
    System.out.println(matcher.group(1)); // 输出 "12"(月份)
    System.out.println(matcher.group(2)); // 输出 "31"(日期)
    System.out.println(matcher.group(3)); // 输出 "2023"(年份)
}
(3) group(String name)(Java 7+)
  • 返回命名捕获组的匹配内容。

  • 命名捕获组通过 (?<name>...) 语法定义。

  • 如果指定的命名捕获组不存在,会抛出 IllegalArgumentException

示例:

复制代码
Pattern pattern = Pattern.compile("(?<month>\\d{2})-(?<day>\\d{2})-(?<year>\\d{4})");
Matcher matcher = pattern.matcher("12-31-2023");

if (matcher.find()) {
    System.out.println(matcher.group("month")); // 输出 "12"
    System.out.println(matcher.group("day"));   // 输出 "31"
    System.out.println(matcher.group("year"));  // 输出 "2023"
}

4. group() 方法的使用步骤

  1. 编译正则表达式

    复制代码
    Pattern pattern = Pattern.compile("(\\d{2})-(\\d{2})-(\\d{4})");
  2. 创建 Matcher 对象

    复制代码
    Matcher matcher = pattern.matcher("12-31-2023");
  3. 执行匹配

    • 使用 find() 方法查找匹配项。

    • 或者使用 matches() 方法检查整个字符串是否匹配。

  4. 提取捕获组

    • 使用 group() 方法提取匹配的内容。

示例:

复制代码
if (matcher.find()) {
    String month = matcher.group(1); // "12"
    String day = matcher.group(2);   // "31"
    String year = matcher.group(3);  // "2023"
    System.out.println("Month: " + month + ", Day: " + day + ", Year: " + year);
}

5. 注意事项

  1. 匹配成功后才能调用 group()

    • 在调用 group() 之前,必须先调用 find()matches() 方法,否则会抛出 IllegalStateException
  2. 捕获组编号从 1 开始

    • group(0) 表示整个匹配的字符串,group(1) 表示第一个捕获组,依此类推。
  3. 捕获组不存在时抛出异常

    • 如果指定的捕获组编号或名称不存在,会抛出 IndexOutOfBoundsExceptionIllegalArgumentException
  4. 命名捕获组需要 Java 7+

    • 命名捕获组功能在 Java 7 及以上版本中支持。

6. 完整示例

以下是一个完整的示例,演示如何使用 group() 方法提取捕获组:

java 复制代码
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RegexExample {
    public static void main(String[] args) {
        String input = "Date: 12-31-2023, Time: 23:59";
        String regex = "(\\d{2})-(\\d{2})-(\\d{4}).*?(\\d{2}):(\\d{2})";
        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(input);

        if (matcher.find()) {
            System.out.println("Month: " + matcher.group(1)); // "12"
            System.out.println("Day: " + matcher.group(2));   // "31"
            System.out.println("Year: " + matcher.group(3));  // "2023"
            System.out.println("Hour: " + matcher.group(4));  // "23"
            System.out.println("Minute: " + matcher.group(5));// "59"
        } else {
            System.out.println("No match found!");
        }
    }
}

总结

  • group() 方法是 Matcher 类的核心方法,用于提取正则表达式匹配的捕获组。

  • 捕获组通过圆括号 () 定义,编号从 1 开始。

  • 使用 group() 前必须调用 find()matches() 方法。

  • 命名捕获组(Java 7+)可以通过名称提取匹配内容。

find() 和 matches() 方法的区别

1. matches() 方法

  • 作用

    • 检查整个输入字符串是否完全匹配正则表达式。

    • 如果整个字符串与正则表达式匹配,返回 true;否则返回 false

  • 匹配范围

    • 必须从字符串的开头匹配到结尾。
  • 示例

    复制代码
    String regex = "a.b"; // 匹配 "a" + 任意字符 + "b"
    String input1 = "aab";
    String input2 = "aabb";
    
    Pattern pattern = Pattern.compile(regex);
    Matcher matcher1 = pattern.matcher(input1);
    Matcher matcher2 = pattern.matcher(input2);
    
    System.out.println(matcher1.matches()); // true,因为 "aab" 完全匹配 "a.b"
    System.out.println(matcher2.matches()); // false,因为 "aabb" 不完全匹配 "a.b"
  • 适用场景

    • 当需要检查整个字符串是否符合某种格式时(例如验证邮箱、电话号码等)。

2. find() 方法

  • 作用

    • 在输入字符串中查找与正则表达式匹配的子串。

    • 如果找到匹配的子串,返回 true;否则返回 false

    • 可以多次调用,每次调用会查找下一个匹配的子串。

  • 匹配范围

    • 不要求整个字符串匹配,只要字符串中包含与正则表达式匹配的子串即可。
  • 示例

    复制代码
    String regex = "a.b"; // 匹配 "a" + 任意字符 + "b"
    String input = "aab aabb";
    
    Pattern pattern = Pattern.compile(regex);
    Matcher matcher = pattern.matcher(input);
    
    while (matcher.find()) {
        System.out.println("Found: " + matcher.group()); // 输出匹配的子串
    }

    输出:

    复制

    复制代码
    Found: aab
    Found: aab
  • 适用场景

    • 当需要从字符串中提取多个匹配的子串时(例如从日志中提取特定格式的数据)。

3. find()matches() 的区别

特性 matches() find()
匹配范围 整个字符串必须完全匹配正则表达式。 字符串中只要包含匹配的子串即可。
返回值 truefalse truefalse
多次调用 每次调用都检查整个字符串。 每次调用查找下一个匹配的子串。
适用场景 验证字符串是否符合某种格式。 提取字符串中符合某种模式的子串。
相关推荐
恋猫de小郭1 小时前
Flutter 新春第一弹,Dart 宏功能推进暂停,后续专注定制数据处理支持
android·java·flutter
vibag1 小时前
Kubernetes(一)
java·云原生·容器·kubernetes
kukubuzai2 小时前
文件(c语言文件流)
c语言·开发语言
ChinaRainbowSea5 小时前
四.4 Redis 五大数据类型/结构的详细说明/详细使用( zset 有序集合数据类型详解和使用)
java·javascript·数据库·redis·后端·nosql
苏-言6 小时前
SSM框架探秘:Spring 整合 Mybatis 框架
java·spring·mybatis
qq_447663057 小时前
java-----多线程
java·开发语言
a辰龙a7 小时前
【Java报错解决】警告: 源发行版 11 需要目标发行版 11
java·开发语言
听海边涛声7 小时前
JDK长期支持版本(LTS)
java·开发语言
IpdataCloud7 小时前
Java 获取本机 IP 地址的方法
java·开发语言·tcp/ip
MyMyMing7 小时前
Java的输入和输出
java·开发语言