Java 的 正则表达式

Java 的 正则表达式(Regular Expression,简称 regex) 主要使用 java.util.regex 包中的 PatternMatcher 类来进行文本匹配和处理。


1. Java 正则表达式的核心类

作用
Pattern 表示编译后的正则表达式。
Matcher 用于执行匹配操作(如查找、替换)。
PatternSyntaxException 用于表示正则表达式语法错误的异常。

2. 正则表达式基本语法

(1)常见的元字符

元字符 作用
. 匹配任意字符(除换行符)
\d 匹配数字 [0-9]
\D 匹配非数字 [^0-9]
\w 匹配单词字符 [a-zA-Z_0-9]
\W 匹配非单词字符 [^a-zA-Z_0-9]
\s 匹配空白字符(空格、制表符、换行符等)
\S 匹配非空白字符
^ 匹配字符串的开始
$ 匹配字符串的结束
\b 匹配单词边界

(2)常见的限定符

限定符 作用
* 匹配前面的字符 0 次或多次 (ab* 可匹配 aababb...)
+ 匹配前面的字符 1 次或多次 (ab+ 只能匹配 ababb...)
? 匹配前面的字符 0 次或 1 次 (ab? 可匹配 aab)
{n} 匹配前面的字符 恰好 n 次
{n,} 匹配前面的字符 至少 n 次
{n,m} 匹配前面的字符 至少 n 次,至多 m 次

(3)字符类(Character Classes)

字符类 作用
[abc] 匹配 abc
[^abc] 匹配除 a、b、c 以外的任意字符
[a-z] 匹配 az 之间的任意小写字母
[A-Z] 匹配 AZ 之间的任意大写字母
[0-9] 匹配 09 之间的任意数字

3. Java 代码示例

(1)匹配手机号

复制代码
import java.util.regex.*;

public class RegexExample {
    public static void main(String[] args) {
        String regex = "1[3-9]\\d{9}";  // 匹配中国大陆手机号
        String text = "我的手机号是 13812345678。";
        
        Pattern pattern = Pattern.compile(regex);
        Matcher matcher = pattern.matcher(text);
        
        if (matcher.find()) {
            System.out.println("匹配到的手机号: " + matcher.group());
        } else {
            System.out.println("未匹配到手机号");
        }
    }
}

输出:

复制代码
匹配到的手机号: 13812345678

(2)验证邮箱格式

复制代码
public class EmailValidation {
    public static void main(String[] args) {
        String regex = "^[a-zA-Z0-9_.-]+@[a-zA-Z0-9-]+\\.[a-zA-Z]+$";
        String email1 = "[email protected]";
        String email2 = "invalid-email.com";

        System.out.println(email1.matches(regex)); // true
        System.out.println(email2.matches(regex)); // false
    }
}

(3)提取字符串中的数字

复制代码
import java.util.regex.*;

public class ExtractNumbers {
    public static void main(String[] args) {
        String text = "订单号: 12345, 价格: 89.99元";
        Pattern pattern = Pattern.compile("\\d+");
        Matcher matcher = pattern.matcher(text);
        
        while (matcher.find()) {
            System.out.println("找到的数字: " + matcher.group());
        }
    }
}

输出:

复制代码
找到的数字: 12345
找到的数字: 89
找到的数字: 99

(4)替换字符串中的内容

复制代码
public class ReplaceText {
    public static void main(String[] args) {
        String text = "Hello, Java! Java is powerful.";
        String replacedText = text.replaceAll("Java", "Python");
        System.out.println(replacedText);
    }
}

输出:

复制代码
Hello, Python! Python is powerful.

4. 常见应用场景

场景 正则表达式
手机号匹配 "1[3-9]\\d{9}"
邮箱匹配 "^[a-zA-Z0-9_.-]+@[a-zA-Z0-9-]+\\.[a-zA-Z]+$"
IP 地址匹配 "\\b(?:\\d{1,3}\\.){3}\\d{1,3}\\b"
提取 HTML 标签内容 "<[^>]+>"
验证 URL `"^(http
过滤非数字字符 "\\D"

5. Pattern 进阶用法

使用 Pattern.compile 进行多次匹配,提高性能

复制代码
Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher("价格是 299 元,折扣价 199 元");

while (matcher.find()) {
    System.out.println(matcher.group());
}

使用 Pattern 标志位(Flags)

复制代码
Pattern pattern = Pattern.compile("hello", Pattern.CASE_INSENSITIVE);
Matcher matcher = pattern.matcher("Hello World");
System.out.println(matcher.find());  // true
相关推荐
AI糊涂是福29 分钟前
MATLAB语言教程:从入门到精通的全面指南
开发语言·matlab·信息可视化
jz_ddk1 小时前
[学习] C语言多维指针探讨(代码示例)
linux·c语言·开发语言·学习·算法
He_k3 小时前
‘js@https://registry.npmmirror.com/JS/-/JS-0.1.0.tgz‘ is not in this registry
开发语言·javascript·ecmascript
星夜9823 小时前
C++回顾 Day6
开发语言·数据结构·c++·算法
琢磨先生David4 小时前
责任链模式:构建灵活可扩展的请求处理体系(Java 实现详解)
java·设计模式·责任链模式
UpUpUp……5 小时前
C++复习
开发语言·c++·笔记
-曾牛5 小时前
使用Spring AI集成Perplexity AI实现智能对话(详细配置指南)
java·人工智能·后端·spring·llm·大模型应用·springai
Xiao Ling.5 小时前
设计模式学习笔记
java
MyikJ6 小时前
Java面试:从Spring Boot到分布式系统的技术探讨
java·大数据·spring boot·面试·分布式系统
艾莉丝努力练剑6 小时前
深入详解编译与链接:翻译环境和运行环境,翻译环境:预编译+编译+汇编+链接,运行环境
c语言·开发语言·汇编·学习