【剑指Offer】19.正则表达式匹配

题目

请实现一个函数用来匹配包括'.'和'*'的正则表达式。

1.模式中的字符'.'表示任意一个字符

2.模式中的字符'*'表示它前面的字符可以出现任意次(包含0次)。

在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配

数据范围:

1.str 只包含从 a-z 的小写字母。

2.pattern 只包含从 a-z 的小写字母以及字符 . 和 *,无连续的 '*'。

  1. 0≤str.length≤26

  2. 0≤pattern.length≤26

示例1

输入:"aaa","a*a"

返回值:true

说明:中间的*可以出现任意次的a,所以可以出现1次a,能匹配上

示例2

输入:"aad","c*a*d"

返回值:true

说明:因为这里 c 为 0 个,a被重复一次, * 表示零个或多个a。因此可以匹配字符串 "aad"。

示例3

输入:"a",".*"

返回值:true

说明:".*" 表示可匹配零个或多个('*')任意字符('.')

示例4

输入:"aaab","a*a*a*c"

返回值:false

解答

源代码

java 复制代码
import java.util.*;


public class Solution {
    /**
     * 代码中的类名、方法名、参数名已经指定,请勿修改,直接返回方法规定的值即可
     *
     * 
     * @param str string字符串 
     * @param pattern string字符串 
     * @return bool布尔型
     */
    public boolean match (String str, String pattern) {
        // write code here
        int m = str.length();
        int n = pattern.length();
        boolean[][] dp = new boolean[m + 1][n + 1];

        for (int i = 0; i <= m; i++) {
            for (int j = 0; j <= n; j++) {
                if (j == 0) {
                    if (i == 0) {
                        dp[i][j] = true;
                    }
                } else {
                    if (pattern.charAt(j - 1) == '*') {
                        // 不和字符串进行匹配
                        if (j >= 2) {
                            dp[i][j] |= dp[i][j - 2];
                        }

                        // 和字符串进行匹配
                        if (i > 0 && j >= 2 && (str.charAt(i - 1) == pattern.charAt(j - 2) || pattern.charAt(j - 2) == '.')) {
                            dp[i][j] |= dp[i - 1][j];
                        }
                    } else {
                        if (i > 0 && (str.charAt(i - 1) == pattern.charAt(j- 1) || pattern.charAt(j - 1) == '.')) {
                            dp[i][j] = dp[i - 1][j - 1];
                        }
                    }
                }
            }
        }

        return dp[m][n];
    }
}

总结

动态规划。

假设主串为 str,模式串为 pattern 从最后一步出发,需要关注最后进来的字符。假设 str 的长度为 n ,pattern的长度为 m ,关注正则表达式 pattern的最后一个字符是谁,它有三种可能,正常字符、'*' 和 '.'(点),那针对这三种情况讨论即可,如下:

1、如果 pattern的最后一个字符是正常字符,那就是看str[n−1] 是否等于 pattern[m−1],相等则看str [0..n−2]与 pattern [0..m−2],不等则是不能匹配,这就是子问题。

2、如果 pattern 的最后一个字符是 '.',它能匹配任意字符,直接看 str [0..n−2]与 pattern [0..m−2]

3、如果 pattern 的最后一个字符是'*',它代表 pattern[m-2]=c 可以重复0次或多次,它们是一个整体 c*

情况一:str[n-1] 是 0 个 c,pattern最后两个字符废了,能否匹配取决于 str [0..n−1]和 pattern [0..m−3]是否匹配

情况二:str[n-1] 是多个 c 中的最后一个(这种情况必须 str[n-1]=c 或者 c='.'),所以str 匹配完往前挪一个,pattern 继续匹配,因为可以匹配多个,继续看str[0..n−2]和 pattern[0..m−1]是否匹配。

dp[i][j] 代表 str 的前 i 个和 pattern 的前 j 个能否匹配。对于前面两个情况,可以合并成一种情况 dp[i][j]=dp[i−1][j−1];对于第三种情况,对于 c* 分为看和不看两种情况:不看:直接砍掉正则串pattern 的后面两个, dp[i][j]=dp[i][j−2];看:正则串pattern 不动,主串str前移一个,dp[i][j]=dp[i−1][j]。

特判:需要考虑空串空正则

空串和空正则是匹配的,dp[0][0]=true。

空串和非空正则,不能直接定义 true 和 false,必须要计算出来。(比如str= '' '' ,pattern=a*b*c*)

非空串和空正则必不匹配,dp[1][0]=...=dp[n][0]=false

非空串和非空正则,那肯定是需要计算的了。

大体上可以分为空正则和非空正则两种,空正则也是比较好处理的,对非空正则我们肯定需要计算,非空正则的三种情况,前面两种可以合并到一起讨论,第三种情况是单独一种,那么也就是分为当前位置是 '*' 和不是 '*' 两种情况了。

相关推荐
_GR12 分钟前
每日OJ题_牛客_牛牛冲钻五_模拟_C++_Java
java·数据结构·c++·算法·动态规划
ROBIN__dyc23 分钟前
表达式
算法
无限大.25 分钟前
c语言200例 067
java·c语言·开发语言
余炜yw26 分钟前
【Java序列化器】Java 中常用序列化器的探索与实践
java·开发语言
攸攸太上26 分钟前
JMeter学习
java·后端·学习·jmeter·微服务
无限大.27 分钟前
c语言实例
c语言·数据结构·算法
Kenny.志29 分钟前
2、Spring Boot 3.x 集成 Feign
java·spring boot·后端
六点半88831 分钟前
【C++】速通涉及 “vector” 的经典OJ编程题
开发语言·c++·算法·青少年编程·推荐算法
不修×蝙蝠32 分钟前
八大排序--01冒泡排序
java
@haihi40 分钟前
冒泡排序,插入排序,快速排序,选择排序
数据结构·算法·排序算法