Java 正则表达式高级用法

Java 中的正则表达式(Regular Expressions)是强大的文本处理工具,可以用于搜索、匹配、替换和分割字符串。Java 提供了 java.util.regex 包来支持正则表达式的使用。以下是一些 Java 正则表达式的高级用法。

1. 使用 PatternMatcher

在 Java 中,正则表达式的使用通常涉及到 PatternMatcher 类。这两个类使得正则表达式的编译和匹配过程更为高效。

复制代码
import java.util.regex.Pattern;
import java.util.regex.Matcher;

String input = "Hello, my email is example@example.com";
String regex = "\\w+@\\w+\\.com";

Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(input);

while (matcher.find()) {
   
    System.out.println("找到的邮箱: " + matcher.group());
}

2. 断言(Assertions)

正则表达式中的断言用于匹配某些条件但不包括这些条件的字符。常见的断言有:

  • 正向前瞻(Positive Lookahead) (?=...)
  • 负向前瞻(Negative Lookahead) (?!...)
  • 正向后顾(Positive Lookbehind) (?<=...)
  • 负向后顾(Negative Lookbehind) (?<!...)

示例:匹配包含数字的单词,但不包含数字。

复制代码
String input = "abc1 def2 ghi";
String regex = "\\b(?=\\w*)(?<!\\d)\\w+\\b";

Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(input);

while (matcher.find()) {
   
    System.out.println("匹配的单词: " + matcher.group());
}

3. 捕获组和命名组

捕获组用于提取匹配到的部分,命名组可以提高可读性。

捕获组
复制代码
String input = "My name is John and I am 30 years old.";
String regex = "name is (\\w+) and I am (\\d+)";

Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(input);

if (matcher.find()) {
   
    System.out.println("姓名: " + matcher.group(1)); // John
    System.out.println("年龄: " + matcher.group(2)); // 30
}
命名组
复制代码
String input = "My name is John and I am 30 years old.";
String regex = "name is (?<name>\\w+) and I am (?<age>\\d+)";

Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(input);

if (matcher.find()) {
   
    System.out.println("姓名: " + matcher.group("name")); // John
    System.out.println("年龄: " + matcher.group("age")); // 30
}

4. 替换操作

使用 Matcher 可以进行文本的替换。

复制代码
String input = "The quick brown fox jumps over the lazy dog.";
String regex = "brown";
String replacement = "black";

String result = input.replaceAll(regex, replacement);
System.out.println("替换后的字符串: " + result); // The quick black fox jumps over the lazy dog.

5. 分割字符串

使用正则表达式来分割字符串。

复制代码
String input = "apple, banana; orange: melon";
String regex = "[,;:]\\s*"; // 逗号、分号、冒号及其后可选空格

String[] fruits = input.split(regex);
for (String fruit : fruits) {
   
    System.out.println(fruit);
}

6. 使用修饰符

可以使用修饰符来修改正则匹配的行为,例如:

  • Pattern.CASE_INSENSITIVE: 忽略大小写
  • Pattern.MULTILINE: 多行模式

例如:

复制代码
String input = "Hello World\nhello world";
String regex = "hello";

Pattern pattern = Pattern.compile(regex, Pattern.CASE_INSENSITIVE | Pattern.MULTILINE);
Matcher matcher = pattern.matcher(input);

while (matcher.find()) {
   
    System.out.println("找到的匹配: " + matcher.group());
}

7. Unicode 支持

Java 正则表达式支持 Unicode 字符,可以用于匹配国际化文本。

复制代码
String input = "你好,世界";
String regex = "\\p{Han}+"; // 匹配汉字

Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(input);

while (matcher.find()) {
   
    System.out.println("找到的中文: " + matcher.group());
}
相关推荐
I'm Jie7 分钟前
(五)Gradle 依赖传递与冲突处理
java·spring boot·spring·kotlin·gradle·maven
我命由我123458 分钟前
Spring Cloud - Spring Cloud 声明式接口调用(Fiegn 声明式接口调用概述、Fiegn 使用)
java·后端·spring·spring cloud·微服务·架构·java-ee
_extraordinary_9 分钟前
Java Spring事务,事务的传播机制
java·开发语言·spring
摸鱼的老谭9 分钟前
Java学习之旅第三季-17:Lambda表达式
java·lambda表达式·1024程序员节
摸鱼的老谭21 分钟前
Java学习之旅第三季-18:方法引用
java·方法引用
lang201509281 小时前
Spring依赖注入与配置全解析
java·spring
百锦再1 小时前
破茧成蝶:全方位解析Java学习难点与征服之路
java·python·学习·struts·kafka·maven·intellij-idea
羊锦磊1 小时前
[ Redis ] SpringBoot集成使用Redis(补充)
java·数据库·spring boot·redis·spring·缓存·json
兮动人2 小时前
Maven 多配置文件的使用
java·maven·maven 多配置文件的使用
毕设源码-钟学长2 小时前
【开题答辩全过程】以 餐健一体化管理系统为例,包含答辩的问题和答案
java·eclipse