leetcode-6-正则表达式匹配

正则表达式匹配

1.题目描述

给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.''*' 的正则表达式匹配。

  • '.' 匹配任意单个字符
  • '*' 匹配零个或多个前面的那一个元素

所谓匹配,是要涵盖 整个 字符串 s 的,而不是部分字符串。

示例 1:

arduino 复制代码
输入: s = "aa", p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。

示例 2:

arduino 复制代码
输入: s = "aa", p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。

示例 3:

arduino 复制代码
输入: s = "ab", p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。

提示:

  • 1 <= s.length <= 20
  • 1 <= p.length <= 20
  • s 只包含从 a-z 的小写字母。
  • p 只包含从 a-z 的小写字母,以及字符 .*
  • 保证每次出现字符 * 时,前面都匹配到有效的字符

2.解决方案

1.暴力递归解法

  1. 思路
  • 从字符串 s 和模式 p 的开头开始匹配。

  • 对于模式 p 中的每个字符,分情况讨论:

    • 如果 p 的当前字符不是 '*',那么 sp 当前字符必须匹配(s 当前字符存在且与 p 当前字符相等或者 p 当前字符为 '.'),然后继续匹配下一个字符。

    • 如果 p 的当前字符是 '*',则有两种情况:

      • '*' 前面的字符匹配 0 次,此时跳过 p'*' 及其前面的字符,继续匹配 p 的下一个字符。
      • '*' 前面的字符匹配至少 1 次,前提是 s 当前字符与 '*' 前面的字符匹配(s 当前字符存在且与 '*' 前面的字符相等或者 '*' 前面的字符为 '.'),然后 s 指针后移一位,继续尝试匹配。
    • sp 都匹配完时,返回 true;否则,返回 false

  1. 代码实现
ts 复制代码
function isMatch(s: string, p: string): boolean {
    if (!p) return!s;
    let firstMatch = s && (s[0] === p[0] || p[0] === '.');
    if (p.length >= 2 && p[1] === '*') {
        return isMatch(s, p.slice(2)) || (firstMatch && isMatch(s.slice(1), p));
    } else {
        return firstMatch && isMatch(s.slice(1), p.slice(1));
    }
}
  1. 分析
  • 时间复杂度 :在最坏情况下,时间复杂度为指数级 (O(2^{m + n})),其中 mn 分别是 sp 的长度。因为对于每个字符,都可能有两种决策('*' 的两种情况)。
  • 空间复杂度 :(O(m + n)),这是由于递归调用栈的深度最大为 m + n
  1. 缺点
  • 时间复杂度高,对于较长的字符串和模式,效率极低,容易超时。

2.动态规划解法

  1. 思路
  • 使用一个二维数组 dp[i][j] 表示 s 的前 i 个字符和 p 的前 j 个字符是否匹配。

  • 初始化 dp[0][0] = true,表示两个空字符串是匹配的。

  • 对于 dp[i][j] 的计算:

  • 如果 p[j - 1] 不是 '*',那么 dp[i][j]true 当且仅当 dp[i - 1][j - 1]trues[i - 1]p[j - 1] 匹配(s[i - 1] 存在且与 p[j - 1] 相等或者 p[j - 1]'.')。

    • 如果 p[j - 1]'*',则有两种情况:

      • '*' 前面的字符匹配 0 次,此时 dp[i][j] = dp[i][j - 2]
      • '*' 前面的字符匹配至少 1 次,前提是 s[i - 1]p[j - 2] 匹配(s[i - 1] 存在且与 p[j - 2] 相等或者 p[j - 2]'.'),此时 dp[i][j] = dp[i - 1][j]
  1. 代码实现
ts 复制代码
function isMatch(s: string, p: string): boolean {
    const m = s.length;
    const n = p.length;
    const dp: boolean[][] = new Array(m + 1).fill(false).map(() => new Array(n + 1).fill(false));
    dp[0][0] = true;
    for (let j = 1; j <= n; j++) {
        if (p[j - 1] === '*') {
            dp[0][j] = dp[0][j - 2];
        }
    }
    for (let i = 1; i <= m; i++) {
        for (let j = 1; j <= n; j++) {
            if (p[j - 1] === '.' || p[j - 1] === s[i - 1]) {
                dp[i][j] = dp[i - 1][j - 1];
            } else if (p[j - 1] === '*') {
                dp[i][j] = dp[i][j - 2];
                if (p[j - 2] === '.' || p[j - 2] === s[i - 1]) {
                    dp[i][j] = dp[i][j] || dp[i - 1][j];
                }
            }
        }
    }
    return dp[m][n];
}
  1. 分析
  • 时间复杂度 :(O(m * n)),其中 mn 分别是 sp 的长度。需要填充整个 dp 数组。
  • 空间复杂度 :(O(m * n)),用于存储 dp 数组。可以通过滚动数组优化到 (O(n)),因为 dp[i][j] 只依赖于 dp[i - 1][j]dp[i][j - 1] 以及 dp[i - 1][j - 1]
  1. 优点
  • 相比暴力递归,时间复杂度大大降低,对于较长的字符串和模式,效率更高。

3.最优解及原因

  1. 最优解
  • 动态规划解法是最优解。
  1. 原因
  • 动态规划解法通过避免重复计算子问题,将时间复杂度从暴力递归的指数级 (O(2^{m + n})) 降低到 (O(m * n))。虽然空间复杂度也为 (O(m * n)),但在实际应用中,其效率的提升更为显著。滚动数组优化后的空间复杂度可进一步降低到 (O(n)),使得在处理长字符串时更具优势。
相关推荐
tumu_C21 小时前
无用知识研究:用sfinae实现函数模板的overload [一]
开发语言·c++·算法
-森屿安年-21 小时前
数据结构——排序
数据结构·算法·排序算法
西望云天21 小时前
Trie树实战:三道典型例题
数据结构·算法·icpc
dragoooon3421 小时前
[优选算法专题三.二分查找——NO.20搜索插入位置 ]
算法·leetcode·动态规划
科技林总21 小时前
【TS3】搭建本地开发环境
学习·typescript
hn小菜鸡1 天前
LeetCode 1089.复写零
算法·leetcode·职场和发展
与己斗其乐无穷1 天前
算法(一)双指针法
数据结构·算法·排序算法
(❁´◡`❁)Jimmy(❁´◡`❁)1 天前
【Trie】 UVA1401 Remember the Word
算法·word·图论
tyro曹仓舒1 天前
彻底讲透as const + keyof typeof
前端·typescript
高山有多高1 天前
从 0 到 1 保姆级实现C语言双向链表
c语言·开发语言·数据结构·c++·算法·visual studio