KMP算法

大家好,今天给大家带来KMP算法的讲解。

问题描述

KMP是用来干嘛的-KMP是用来找字符串str1中是否有字符串str2。我们知道暴力算法实现该问题时是逐个匹配:从str1的0位置开始匹配,如果0位置字符和str2的0位置字符相同,则指针同时后移,继续匹配。若不相同,则str2指针归零,继续匹配。KMP算法可以对此实现加速,具体细节听我细细道来。

KMP算法细节

next数组

next数组是用来干嘛的?是用来记录str2每个位置前面的字符串前缀和后缀的最大公共长度。举个例子:str2="abastzabast"。

i=0时,其前名无字符串,人为设定为-1,即next【0】=-1。i=1时,其前名字符串为a,由于前缀和后缀均不能为字符串本身,因此next【1】=0。当i=2时,前面字符串为ab,前缀为:a,后缀为:b,无公共部分,next【2】=0。当i=3时,其前面字符串为aba,前缀为:a,ab。后缀为:a,ba。最大公共长度为1(a),因此next【3】=1。同理其它位置,如next【10】,即t位置处,其前面字符串为abastzaba,最大公共部分为:aba,因此next【10】=3。

有了next数组的概念,我们就可以进行KMP算法的讲解了。

KMP分析

因此我们可以判断:当str1和str2出现不匹配现象时,用于str2遍历的元素j变为next【j】,相当于前缀替换掉原来的后缀,重新匹配。当j=0时,next【0】=-1,也就说明:str2从开始位置0与str1进行匹配也无法匹配,此时需要负责str1遍历的指针i++ 。当str1和str2某个位置匹配时:只需i++,j++即可。当j=str2.length()时,说明匹配成功返回i-j,否则返回-1(未成功匹配)。这是因为只有某个位置匹配时j才会增大1,当其为str2.length()时,说明匹配成功str2.length()次,即完全匹配。

KMP代码细节

cpp 复制代码
int KMP(string str1,string str2,int *next){
	int i=0,j=0;
	while(i<str1.length()&&j<str2.length()){
		if(str1[i]==str2[j]){
			i++;
			j++;
		}else if(next[j]==-1){//j==0
			i++;
		}else{
			j=next[j];
		}
	}
	return j==str2.length()?i-j:-1;//只有j走到length才匹配否则不匹配 
}

next数组求解代码

上述KMP代码需要用到next数组,我们只讲了next数组含义,那如何求解呢?首先我们应该知道,next【0】=-1,next【1】=0这是肯定的。

我们要求next【i】,就要查看i-1位置和cnt位置处元素是否相等(cnt为next【i-1】),如果相等则next【i】=next【i-1】+1=cnt+1。不想等,则让cnt=next【cnt】,重复操作。当cnt=0时,仍然不相等那么next【i】=0。(首尾元素都不相等不可能有公共前后缀部分)

cpp 复制代码
int* getnext(string str){
	int *next=new int[str.length()];//只能动态申请空间否则函数结束会被释放 
	next[0]=-1;
	next[1]=0;
	int i=2,cnt=0;
	while(i<str.length()){
		if(str[i-1]==str[cnt]){
			next[i++]=++cnt;
		}else if(cnt>0){
			cnt=next[cnt];
		}else{
			next[i++]=0;
		}
	}
	return next;
}

完整代码

cpp 复制代码
#include<iostream>
using namespace std;
int KMP(string str1,string str2,int *next){
	int i=0,j=0;
	while(i<str1.length()&&j<str2.length()){
		if(str1[i]==str2[j]){
			i++;
			j++;
		}else if(next[j]==-1){//j==0
			i++;
		}else{
			j=next[j];
		}
	}
	return j==str2.length()?i-j:-1;//只有j走到length才匹配否则不匹配 
}
int* getnext(string str){
	int *next=new int[str.length()];//只能动态申请空间否则函数结束会被释放 
	next[0]=-1;
	next[1]=0;
	int i=2,cnt=0;
	while(i<str.length()){
		if(str[i-1]==str[cnt]){
			next[i++]=++cnt;
		}else if(cnt>0){
			cnt=next[cnt];
		}else{
			next[i++]=0;
		}
	}
	return next;
}
int main(){
	string str1="abcbnshdg";
	string str2="nsh";
	int *next=getnext(str2);
	int location=KMP(str1,str2,next);
	cout<<location;
} 

本期对于KMP的代码分享至此,创作不易,大家多多支持!!

相关推荐
颜酱36 分钟前
单调队列:滑动窗口极值问题的最优解(通用模板版)
javascript·后端·算法
Gorway7 小时前
解析残差网络 (ResNet)
算法
拖拉斯旋风7 小时前
LeetCode 经典算法题解析:优先队列与广度优先搜索的巧妙应用
算法
Wect7 小时前
LeetCode 207. 课程表:两种解法(BFS+DFS)详细解析
前端·算法·typescript
灵感__idea21 小时前
Hello 算法:众里寻她千“百度”
前端·javascript·算法
Wect1 天前
LeetCode 130. 被围绕的区域:两种解法详解(BFS/DFS)
前端·算法·typescript
NAGNIP2 天前
一文搞懂深度学习中的通用逼近定理!
人工智能·算法·面试
颜酱2 天前
单调栈:从模板到实战
javascript·后端·算法
CoovallyAIHub2 天前
仿生学突破:SILD模型如何让无人机在电力线迷宫中发现“隐形威胁”
深度学习·算法·计算机视觉
CoovallyAIHub2 天前
从春晚机器人到零样本革命:YOLO26-Pose姿态估计实战指南
深度学习·算法·计算机视觉