KMP算法

大家好,今天给大家带来KMP算法的讲解。

问题描述

KMP是用来干嘛的-KMP是用来找字符串str1中是否有字符串str2。我们知道暴力算法实现该问题时是逐个匹配:从str1的0位置开始匹配,如果0位置字符和str2的0位置字符相同,则指针同时后移,继续匹配。若不相同,则str2指针归零,继续匹配。KMP算法可以对此实现加速,具体细节听我细细道来。

KMP算法细节

next数组

next数组是用来干嘛的?是用来记录str2每个位置前面的字符串前缀和后缀的最大公共长度。举个例子:str2="abastzabast"。

i=0时,其前名无字符串,人为设定为-1,即next【0】=-1。i=1时,其前名字符串为a,由于前缀和后缀均不能为字符串本身,因此next【1】=0。当i=2时,前面字符串为ab,前缀为:a,后缀为:b,无公共部分,next【2】=0。当i=3时,其前面字符串为aba,前缀为:a,ab。后缀为:a,ba。最大公共长度为1(a),因此next【3】=1。同理其它位置,如next【10】,即t位置处,其前面字符串为abastzaba,最大公共部分为:aba,因此next【10】=3。

有了next数组的概念,我们就可以进行KMP算法的讲解了。

KMP分析

因此我们可以判断:当str1和str2出现不匹配现象时,用于str2遍历的元素j变为next【j】,相当于前缀替换掉原来的后缀,重新匹配。当j=0时,next【0】=-1,也就说明:str2从开始位置0与str1进行匹配也无法匹配,此时需要负责str1遍历的指针i++ 。当str1和str2某个位置匹配时:只需i++,j++即可。当j=str2.length()时,说明匹配成功返回i-j,否则返回-1(未成功匹配)。这是因为只有某个位置匹配时j才会增大1,当其为str2.length()时,说明匹配成功str2.length()次,即完全匹配。

KMP代码细节

cpp 复制代码
int KMP(string str1,string str2,int *next){
	int i=0,j=0;
	while(i<str1.length()&&j<str2.length()){
		if(str1[i]==str2[j]){
			i++;
			j++;
		}else if(next[j]==-1){//j==0
			i++;
		}else{
			j=next[j];
		}
	}
	return j==str2.length()?i-j:-1;//只有j走到length才匹配否则不匹配 
}

next数组求解代码

上述KMP代码需要用到next数组,我们只讲了next数组含义,那如何求解呢?首先我们应该知道,next【0】=-1,next【1】=0这是肯定的。

我们要求next【i】,就要查看i-1位置和cnt位置处元素是否相等(cnt为next【i-1】),如果相等则next【i】=next【i-1】+1=cnt+1。不想等,则让cnt=next【cnt】,重复操作。当cnt=0时,仍然不相等那么next【i】=0。(首尾元素都不相等不可能有公共前后缀部分)

cpp 复制代码
int* getnext(string str){
	int *next=new int[str.length()];//只能动态申请空间否则函数结束会被释放 
	next[0]=-1;
	next[1]=0;
	int i=2,cnt=0;
	while(i<str.length()){
		if(str[i-1]==str[cnt]){
			next[i++]=++cnt;
		}else if(cnt>0){
			cnt=next[cnt];
		}else{
			next[i++]=0;
		}
	}
	return next;
}

完整代码

cpp 复制代码
#include<iostream>
using namespace std;
int KMP(string str1,string str2,int *next){
	int i=0,j=0;
	while(i<str1.length()&&j<str2.length()){
		if(str1[i]==str2[j]){
			i++;
			j++;
		}else if(next[j]==-1){//j==0
			i++;
		}else{
			j=next[j];
		}
	}
	return j==str2.length()?i-j:-1;//只有j走到length才匹配否则不匹配 
}
int* getnext(string str){
	int *next=new int[str.length()];//只能动态申请空间否则函数结束会被释放 
	next[0]=-1;
	next[1]=0;
	int i=2,cnt=0;
	while(i<str.length()){
		if(str[i-1]==str[cnt]){
			next[i++]=++cnt;
		}else if(cnt>0){
			cnt=next[cnt];
		}else{
			next[i++]=0;
		}
	}
	return next;
}
int main(){
	string str1="abcbnshdg";
	string str2="nsh";
	int *next=getnext(str2);
	int location=KMP(str1,str2,next);
	cout<<location;
} 

本期对于KMP的代码分享至此,创作不易,大家多多支持!!

相关推荐
IT猿手1 小时前
基于强化学习 Q-learning 算法求解城市场景下无人机三维路径规划研究,提供完整MATLAB代码
神经网络·算法·matlab·人机交互·无人机·强化学习·无人机三维路径规划
万能程序员-传康Kk5 小时前
旅游推荐数据分析可视化系统算法
算法·数据分析·旅游
PXM的算法星球5 小时前
【并发编程基石】CAS无锁算法详解:原理、实现与应用场景
算法
ll7788115 小时前
C++学习之路,从0到精通的征途:继承
开发语言·数据结构·c++·学习·算法
烨然若神人~5 小时前
算法第十七天|654. 最大二叉树、617.合并二叉树、700.二叉搜索树中的搜索、98.验证二叉搜索树
算法
爱coding的橙子5 小时前
每日算法刷题Day2 5.10:leetcode数组1道题3种解法,用时40min
算法·leetcode
Akiiiira5 小时前
【数据结构】栈
数据结构
程序媛小盐6 小时前
贪心算法:最小生成树
算法·贪心算法·图论
Panesle6 小时前
分布式异步强化学习框架训练32B大模型:INTELLECT-2
人工智能·分布式·深度学习·算法·大模型
c6lala6 小时前
数据结构day1
数据结构