正则表达式

文章目录

正则表达式

正则表达式(Regular Expression,简称Regex或RegExp)是一种对字符串操作的一种逻辑公式,它是用事先定义好的一些特定字符以及这些特定字符的组合,组成一个"规则字符串",这个"规则字符串"用来表达对字符串的一种过滤逻辑。正则表达式主要用于字符串的验证、搜索和替换。
1.正则表达式的组成

正则表达式由普通字符(如a到z的字母)和特殊字符(称为"元字符")组成。元字符在正则表达式中具有特殊的含义,用于表示位置、重复、选择等。
2.元字符介绍

字符匹配

.:匹配除换行符以外的任意单个字符。

...:字符集合,匹配方括号内的任意字符。例如,abc匹配a、b或c。

\^...:否定的字符集合,匹配不在方括号内的任意字符。

位置指定

^:匹配输入字符串的开始位置。
KaTeX parse error: Undefined control sequence: \b at position 16: :匹配输入字符串的结束位置。 \̲b̲:匹配一个单词边界,即单词的开...:匹配整个字符串为5到12位数字。

匹配IP地址:

((250-5|20-40-9|01?0-90-9?)\.){3}(250-5|20-40-9|01?0-90-9?)

匹配电话号码:

(?0\d{2}) -?\d{8}
4、正则表达式的使用

正则表达式在不同的编程语言中有不同的实现方式,但基本原理相同。以下是在一些常见编程语言中使用正则表达式的简单示例:

复制代码
JavaScript:
let regex = /^\d{5,12}$/;  
let result = regex.test("12345678901"); // true
Python:

import re  
pattern = re.compile(r'^\d{5,12}$')  
result = pattern.match("12345678901")  
if result:  
    print("Match")
Java:
String regex = "^\\d{5,12}$";  
boolean result = "12345678901".matches(regex); // true

正则表达式是一个功能强大的工具,能够处理复杂的文本匹配问题。然而,由于其语法较为复杂,对于初学者来说可能需要一定的时间来掌握。

常见应用

搜索文本:在文本中查找符合特定模式的子字符串。

文本替换:根据正则表达式匹配结果替换文本。

输入验证:验证输入是否符合特定格式,如邮箱、电话号码等。

数据提取:从文本中提取特定模式的数据。

Java中常用的正则

在Java中,正则表达式(Regular Expressions)是一种强大的文本处理工具,它允许你通过指定模式来匹配、搜索、替换文本。Java的java.util.regex包提供了对正则表达式的支持,主要类有Pattern和Matcher。

以下是一些常用的正则表达式示例,这些示例涵盖了常见的文本处理需求:

匹配电子邮件地址:

\bA-Za-z0-9._%±+@A-Za-z0-9.-+\.A-Z\|a-z{2,}\b

匹配URL:

https?😕/(?:-\\w\\.|(?:%\\da-fA-F{2}))+

匹配IP地址(IPv4):

((250-5|20-40-9|01?0-90-9?)\.){3}(250-5|20-40-9|01?0-90-9?)

匹配手机号码(以中国大陆11位手机号为例):

^13-9\d{9}$

匹配身份证号码(中国大陆18位身份证号码):
[1](#1)\d{5}(18|19|20)\d{2}((01-9)|(10|11|12))((0-21-9)|10|20|30|31)\d{3}\\dXx$

匹配整数:

-?\d+

匹配浮点数(包括正数、负数和小数):

-?\d+(\.\d+)?

匹配中文字符:

\\u4e00-\\u9fa5

匹配由数字和字母组成的字符串:

A-Za-z0-9+

匹配HTML标签:

<(a-z+)(\^\<+)(?:>(. )</\1>|\s*\/>)

请注意,正则表达式的编写依赖于你的具体需求,上述示例可能需要根据实际情况进行调整。

在Java中使用这些正则表达式时,你通常会首先使用Pattern.compile(String regex)方法编译正则表达式,然后使用matcher(CharSequence input)方法创建一个Matcher对象,最后使用Matcher对象的方法来执行匹配、查找等操作。例如:

复制代码
String email = "example@example.com";  
String emailRegex = "\\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\\.[A-Z|a-z]{2,}\\b";  
Pattern pattern = Pattern.compile(emailRegex);  
Matcher matcher = pattern.matcher(email);  
boolean isEmail = matcher.matches(); // 判断是否匹配

RegexUtils

复制代码
import java.util.regex.Pattern;

/**
 * 正则工具类
 *
 * @author jjee
 */
public class RegexUtils {
    /**
     * 校验正则表达式是否合法
     */
    public static boolean checkRegx(String regx) {
        try {
            Pattern.compile(regx);
            return true;
        } catch (Exception e) {
            return false;
        }
    }

    /**
     * 判断是否为整数
     * @param str 传入的字符串
     * @return 是整数返回true,否则返回false
     */
    public static boolean isInteger(String str) {

        Pattern pattern = Pattern.compile("^[-\\+]?[\\d]*$");

        return pattern.matcher(str).matches();

    }

    //正则表达式判断字符串是否仅含有数字和字母和中文
    public static boolean isLetterDigit(String str) {
        String regex = "^[\\u4e00-\\u9fa50-9a-zA-Z]+$";
        return str.matches(regex);
    }

    //正则表达式判断字符串是否仅英文字符
    public static boolean isAandZ(String str) {
        String regex = "^[a-zA-Z]*";
        return str.matches(regex);
    }

    //正则表达式判断字符串是否仅含有数字和字母
    public static boolean isAandZandNum(String str) {
        String regex = "^[0-9a-zA-Z]+$";
        return str.matches(regex);
    }

}

  1. 1-9 ↩︎
相关推荐
朦胧之8 小时前
AI 编程-老项目改造篇
java·前端·后端
程序猿大帅12 小时前
别再只当调包侠了:用 Spring AI 落地 Function Calling,我被大模型硬生生砸出了三个大坑
java
程序员晓琪13 小时前
约定大于配置:基于 Java 包名自动生成 API 版本路由的最佳实践
java·spring boot·后端
Flittly13 小时前
【AgentScope Java新手村系列】(11)中断与恢复
java·spring boot·spring
众少成多积小致巨14 小时前
JNI (Java Native Interface) 技术手册中文参考指南
android·java·c++
东坡白菜14 小时前
破局全栈:前端开发的Java入门实战记录—JPA(2)
java·后端
SimonKing20 小时前
艹,维护AI写的代码,我心态崩了......
java·后端·程序员
用户2986985301420 小时前
Java Word 文档样式进阶:段落与文本背景色设置完全指南
java·后端
小bo波1 天前
从"任意文件复制"深挖Java I/O:字符流与字节流的本质抉择
java·nio·io流·后端开发·文件复制
nanxun8863 天前
记一次诡异的 Docker 容器"串包"故障排查
java