【LeetCode 刷题】字符串-字符串匹配(KMP)

此博客为《代码随想录》字符串章节的学习笔记,主要内容为字符串匹配 KMP 算法相关的题目解析。

文章目录

  • [28. 找出字符串中第一个匹配项的下标](#28. 找出字符串中第一个匹配项的下标)
  • [459. 重复的子字符串](#459. 重复的子字符串)

28. 找出字符串中第一个匹配项的下标

题目链接

python 复制代码
class Solution:
    def getNext(self, s: str) -> List[int]:
        j, nxt = 0, [0] * len(s)
        for i in range(1, len(s)):
            while j > 0 and s[i] != s[j]:
                j = nxt[j - 1]
            if s[i] == s[j]:
                j += 1
            nxt[i] = j
        return nxt
        
    def strStr(self, haystack: str, needle: str) -> int:
        j, nxt = 0, self.getNext(needle)
        for i in range(len(haystack)):
            while j > 0 and haystack[i] != needle[j]:
                j = nxt[j - 1]
            if haystack[i] == needle[j]:
                j += 1
            if j == len(needle):
                return i - j + 1
        return -1
  • getNext 用于计算 next 数组,next 数组是模式串的特征规律,与文本串无关
  • 在此代码中的 next 数组的定义下,每次遇到矛盾,都需要查找上一个元素next 数组中的值,以确定回溯位置
  • getNext 函数中 j 表示的是目前最长公共前后缀的长度(也指向着公共前缀的末尾);i 指向着公共后缀的末尾
  • getNext 的 for 循环:i 从 1 开始 ,因为 i 为 0 时表示着长度为 1 的串,最长公共前后缀长度为 0,即 next[0] = 0(在数组初始化时已经完成)
  • strStr 的 for 循环:i 从 0 开始 ,完整遍历文本串 haystack

459. 重复的子字符串

题目链接

python 复制代码
class Solution:
    def getNext(self, s: str) -> List[int]:
        j, nxt = 0, [0] * len(s)
        for i in range(1, len(s)):
            while j > 0 and s[i] != s[j]:
                j = nxt[j - 1]
            if s[i] == s[j]:
                j += 1
            nxt[i] = j
        return nxt

    def repeatedSubstringPattern(self, s: str) -> bool:
        nxt = self.getNext(s)
        if nxt[-1] != 0 and len(s) % (len(s) - nxt[-1]) == 0:
            return True
        return False
  • 如果字符串 s 是由重复子串组成,那么最长相等前后缀不包含的子串 一定是 s 的最小重复子串,证明过程
  • 因此仿照 KMP 算法计算 next 数组,判断是否存在最长相等前后缀,以及最长相等前后缀不包含的子串的长度 len(s) - nxt[-1] ,是否能够被原字符串长度整除

移动匹配法(通用做法)

python 复制代码
class Solution:
    def repeatedSubstringPattern(self, s: str) -> bool:
        s_ = (s + s)[1:-1]
        return s in s_
  • 自身加自身得到 s_,之后移除第一和最后一个元素(破坏原始串),判断 s_ 中是否包含自身 s
相关推荐
竹子_2316 分钟前
《零基础入门AI:传统机器学习核心算法解析(KNN、模型调优与朴素贝叶斯)》
人工智能·算法·机器学习
boyedu16 分钟前
哈希指针与数据结构:构建可信数字世界的基石
数据结构·算法·区块链·哈希算法·加密货币
SiYuanFeng34 分钟前
【问题未解决-寻求帮助】VS Code 中使用 Conda 环境,运行 Python 后 PowerShell 终端输出内容立即消失
开发语言·python·conda
✿ ༺ ོIT技术༻37 分钟前
剑指offer第2版:双指针+排序+分治+滑动窗口
算法·排序算法·剑指offer·双指针·滑动窗口·分治
段ヤシ.1 小时前
Windows环境下安装Python和PyCharm
开发语言·python·pycharm
细嗅蔷薇@1 小时前
C语言在键盘上输入一个3行3列矩阵的各个元素的值(值为整数),然后输出主对角线元素的积,并在fun()函数中输出。
c语言·算法·矩阵
新时代苦力工2 小时前
桶排序-Java实现
数据结构·算法·排序算法
测试19982 小时前
Newman+Jenkins实施接口自动化测试
自动化测试·软件测试·python·测试工具·职场和发展·jenkins·测试用例
feuiw2 小时前
django-3模型操作
python·django
计算机毕设定制辅导-无忧学长2 小时前
InfluxDB 与 Python 框架结合:Django 应用案例(一)
python·django·sqlite