字符串匹配 之 KMP算法

文章目录

本博客充分参考灵神和知乎的另一位博主

灵神KMP算法模版
知乎博主通俗易懂讲解

  • 对于给定一个主串S和一个模式串P,如果让你求解出模式串P在主串S中匹配的情况下的所有的开始下标
  • 简单的做法又称为Brute-Force算法,其实总的来说就是,外层循环遍历主串S,内存循环遍历模式串P,逐个匹配,当出现匹配不成功的情况,外层循环回到开始匹配位置+1,内层循环直接返回位置0,可想而知,这个算法的时间复杂度是o(n*m)
  • KMP算法的改进思路,就是比较的时候,肯定是一个个比较的,这个是不能改进的,主要是可以降低比较趟数
    • 外层循环主串S不会退,只回退模式串P,并且模式串P回退的时候充分利用真前缀和真后缀的最大匹配的长度!

话不多说,大家可以看上面知乎的讲解就可以啦!

KMP算法python 模版

模版解决的问题:在主串s中查找模式串p,返回所有成功匹配的位置

python 复制代码
def kmp(s: str, p: str) -> List[int]:
    m = len(p)
    # next[i] 表示p[0] 到 p[i] 的真前缀和真后缀的最大匹配长度
    next = [0] * m
    # cnt 用于记录当前模式串p的真前缀和真后缀的最大匹配长度
    cnt = 0
    for i in range(1, m):
        b = p[i]
        while cnt and p[cnt] != b:
            cnt = pi[cnt - 1]
        if p[cnt] == b:
            cnt += 1
        next[i] = cnt
	
	# 记录答案
    pos = []
    # cnt 用于存储主串s和模式串p的匹配长度
    cnt = 0
    for i, b in enumerate(text):
    	# 不相等就让模式串p回退
        while cnt and p[cnt] != b:
            cnt = next[cnt - 1]
        if p[cnt] == b:
            cnt += 1
        if cnt == len(p):
            pos.append(i - m + 1)
            # 注意这个
            cnt = next[cnt - 1]
    return pos

习题

28.找出字符串中第一个匹配项的下标

28.找出字符串中第一个匹配项的下标

  • 典型的KMP算法的模版题目
python 复制代码
class Solution:
    def strStr(self, haystack: str, needle: str) -> int:
        # KMP算法
        m = len(needle)
        next = [0]*m 
        cnt = 0
        # 预处理next数组
        for i in range(1,m):
            b = needle[i]
            while cnt and needle[cnt] != b :
                cnt = next[cnt-1]
            if needle[cnt] == b:
                cnt += 1
            next[i] = cnt 
        
        # 开始匹配
        cnt = 0 
        for i,b in enumerate(haystack):
            while cnt and needle[cnt] != b:
                cnt = next[cnt-1]
            
            if needle[cnt] == b:
                cnt += 1
            
            if cnt == m:
                return i - m + 1
        
        return -1

1392.最长快乐前缀

1392.最长快乐前缀

  • 算法思路:直接使用KMP算法进行求解,最终的next[m-1]就是最大的长度
python 复制代码
class Solution:
    def longestPrefix(self, s: str) -> str:
        # 这个就是knp算法的max(next)
        m = len(s)
        next = [0]*(m)
        cnt = 0 
        ans = 0
        for i in range(1,m):
            b = s[i]
            while cnt and s[cnt] != b:
                cnt = next[cnt-1]
            if s[cnt] == b:
                cnt += 1
            next[i] = cnt
        return s[:next[m-1]] if next[m-1] > 0 else ""
相关推荐
田梓燊几秒前
leetcode 189
算法·leetcode·职场和发展
wuweijianlove14 分钟前
算法复杂度的理论边界与实验验证研究的技术3
算法
rm6fEx0Z720 分钟前
AUC 与 GAUC:从全局排序到用户内排序的理解
人工智能·算法·机器学习
minji...21 分钟前
Linux 多线程(四)线程等待,线程分离,线程管理,C++多线程,pthread库
linux·运维·开发语言·网络·c++·算法
H_BB28 分钟前
DFS实现回溯算法
数据结构·c++·算法·深度优先
汀、人工智能29 分钟前
[特殊字符] 第17课:滑动窗口最大值
数据结构·算法·数据库架构·图论·bfs·滑动窗口最大值
XiYang-DING39 分钟前
【LeetCode】232. 用栈实现队列
算法·leetcode·职场和发展
人道领域40 分钟前
【LeetCode刷题日记】142.环形链表Ⅱ
算法·leetcode·链表
2301_822703201 小时前
开源鸿蒙跨平台Flutter开发:基因序列比对基础:Needleman-Wunsch 算法的 Dart 实现
算法·flutter·开源·鸿蒙
Book思议-1 小时前
【数据结构】「树」专题:树、森林与二叉树遍历之间的关系+408真题
数据结构·算法·二叉树··森林