KMP算法

大家好,今天给大家带来KMP算法的讲解。

问题描述

KMP是用来干嘛的-KMP是用来找字符串str1中是否有字符串str2。我们知道暴力算法实现该问题时是逐个匹配:从str1的0位置开始匹配,如果0位置字符和str2的0位置字符相同,则指针同时后移,继续匹配。若不相同,则str2指针归零,继续匹配。KMP算法可以对此实现加速,具体细节听我细细道来。

KMP算法细节

next数组

next数组是用来干嘛的?是用来记录str2每个位置前面的字符串前缀和后缀的最大公共长度。举个例子:str2="abastzabast"。

i=0时,其前名无字符串,人为设定为-1,即next【0】=-1。i=1时,其前名字符串为a,由于前缀和后缀均不能为字符串本身,因此next【1】=0。当i=2时,前面字符串为ab,前缀为:a,后缀为:b,无公共部分,next【2】=0。当i=3时,其前面字符串为aba,前缀为:a,ab。后缀为:a,ba。最大公共长度为1(a),因此next【3】=1。同理其它位置,如next【10】,即t位置处,其前面字符串为abastzaba,最大公共部分为:aba,因此next【10】=3。

有了next数组的概念,我们就可以进行KMP算法的讲解了。

KMP分析

因此我们可以判断:当str1和str2出现不匹配现象时,用于str2遍历的元素j变为next【j】,相当于前缀替换掉原来的后缀,重新匹配。当j=0时,next【0】=-1,也就说明:str2从开始位置0与str1进行匹配也无法匹配,此时需要负责str1遍历的指针i++ 。当str1和str2某个位置匹配时:只需i++,j++即可。当j=str2.length()时,说明匹配成功返回i-j,否则返回-1(未成功匹配)。这是因为只有某个位置匹配时j才会增大1,当其为str2.length()时,说明匹配成功str2.length()次,即完全匹配。

KMP代码细节

cpp 复制代码
int KMP(string str1,string str2,int *next){
	int i=0,j=0;
	while(i<str1.length()&&j<str2.length()){
		if(str1[i]==str2[j]){
			i++;
			j++;
		}else if(next[j]==-1){//j==0
			i++;
		}else{
			j=next[j];
		}
	}
	return j==str2.length()?i-j:-1;//只有j走到length才匹配否则不匹配 
}

next数组求解代码

上述KMP代码需要用到next数组,我们只讲了next数组含义,那如何求解呢?首先我们应该知道,next【0】=-1,next【1】=0这是肯定的。

我们要求next【i】,就要查看i-1位置和cnt位置处元素是否相等(cnt为next【i-1】),如果相等则next【i】=next【i-1】+1=cnt+1。不想等,则让cnt=next【cnt】,重复操作。当cnt=0时,仍然不相等那么next【i】=0。(首尾元素都不相等不可能有公共前后缀部分)

cpp 复制代码
int* getnext(string str){
	int *next=new int[str.length()];//只能动态申请空间否则函数结束会被释放 
	next[0]=-1;
	next[1]=0;
	int i=2,cnt=0;
	while(i<str.length()){
		if(str[i-1]==str[cnt]){
			next[i++]=++cnt;
		}else if(cnt>0){
			cnt=next[cnt];
		}else{
			next[i++]=0;
		}
	}
	return next;
}

完整代码

cpp 复制代码
#include<iostream>
using namespace std;
int KMP(string str1,string str2,int *next){
	int i=0,j=0;
	while(i<str1.length()&&j<str2.length()){
		if(str1[i]==str2[j]){
			i++;
			j++;
		}else if(next[j]==-1){//j==0
			i++;
		}else{
			j=next[j];
		}
	}
	return j==str2.length()?i-j:-1;//只有j走到length才匹配否则不匹配 
}
int* getnext(string str){
	int *next=new int[str.length()];//只能动态申请空间否则函数结束会被释放 
	next[0]=-1;
	next[1]=0;
	int i=2,cnt=0;
	while(i<str.length()){
		if(str[i-1]==str[cnt]){
			next[i++]=++cnt;
		}else if(cnt>0){
			cnt=next[cnt];
		}else{
			next[i++]=0;
		}
	}
	return next;
}
int main(){
	string str1="abcbnshdg";
	string str2="nsh";
	int *next=getnext(str2);
	int location=KMP(str1,str2,next);
	cout<<location;
} 

本期对于KMP的代码分享至此,创作不易,大家多多支持!!

相关推荐
feilieren14 分钟前
leetcode - 684. 冗余连接
java·开发语言·算法
余~1853816280024 分钟前
矩阵系统源码搭建,OEM贴牌技术
网络·人工智能·线性代数·算法·矩阵
Tianwen_Burning34 分钟前
Halcon相机外参自理解
算法
dawn1912282 小时前
Java 中的正则表达式详解
java·开发语言·算法·正则表达式·1024程序员节
黑不拉几的小白兔2 小时前
PTA L1系列题解(C语言)(L1_097 -- L1_104)
数据结构·算法·1024程序员节
南城花随雪。2 小时前
蚁群算法(Ant Colony Optimization)详细解读
算法
秋说2 小时前
【数据结构 | PTA】懂蛇语
数据结构·c++
lLinkl3 小时前
Java面试经典 150 题.P27. 移除元素(002)
算法
tangguofeng3 小时前
合并排序算法(C语言版)
算法
ChaoZiLL3 小时前
关于我的数据结构与算法——初阶第二篇(排序)
数据结构·算法