大家好,今天给大家带来KMP算法的讲解。
问题描述
KMP是用来干嘛的-KMP是用来找字符串str1中是否有字符串str2。我们知道暴力算法实现该问题时是逐个匹配:从str1的0位置开始匹配,如果0位置字符和str2的0位置字符相同,则指针同时后移,继续匹配。若不相同,则str2指针归零,继续匹配。KMP算法可以对此实现加速,具体细节听我细细道来。
KMP算法细节
next数组
next数组是用来干嘛的?是用来记录str2每个位置前面的字符串前缀和后缀的最大公共长度。举个例子:str2="abastzabast"。
i=0时,其前名无字符串,人为设定为-1,即next【0】=-1。i=1时,其前名字符串为a,由于前缀和后缀均不能为字符串本身,因此next【1】=0。当i=2时,前面字符串为ab,前缀为:a,后缀为:b,无公共部分,next【2】=0。当i=3时,其前面字符串为aba,前缀为:a,ab。后缀为:a,ba。最大公共长度为1(a),因此next【3】=1。同理其它位置,如next【10】,即t位置处,其前面字符串为abastzaba,最大公共部分为:aba,因此next【10】=3。
有了next数组的概念,我们就可以进行KMP算法的讲解了。
KMP分析
因此我们可以判断:当str1和str2出现不匹配现象时,用于str2遍历的元素j变为next【j】,相当于前缀替换掉原来的后缀,重新匹配。当j=0时,next【0】=-1,也就说明:str2从开始位置0与str1进行匹配也无法匹配,此时需要负责str1遍历的指针i++ 。当str1和str2某个位置匹配时:只需i++,j++即可。当j=str2.length()时,说明匹配成功返回i-j,否则返回-1(未成功匹配)。这是因为只有某个位置匹配时j才会增大1,当其为str2.length()时,说明匹配成功str2.length()次,即完全匹配。
KMP代码细节
cpp
int KMP(string str1,string str2,int *next){
int i=0,j=0;
while(i<str1.length()&&j<str2.length()){
if(str1[i]==str2[j]){
i++;
j++;
}else if(next[j]==-1){//j==0
i++;
}else{
j=next[j];
}
}
return j==str2.length()?i-j:-1;//只有j走到length才匹配否则不匹配
}
next数组求解代码
上述KMP代码需要用到next数组,我们只讲了next数组含义,那如何求解呢?首先我们应该知道,next【0】=-1,next【1】=0这是肯定的。
我们要求next【i】,就要查看i-1位置和cnt位置处元素是否相等(cnt为next【i-1】),如果相等则next【i】=next【i-1】+1=cnt+1。不想等,则让cnt=next【cnt】,重复操作。当cnt=0时,仍然不相等那么next【i】=0。(首尾元素都不相等不可能有公共前后缀部分)
cpp
int* getnext(string str){
int *next=new int[str.length()];//只能动态申请空间否则函数结束会被释放
next[0]=-1;
next[1]=0;
int i=2,cnt=0;
while(i<str.length()){
if(str[i-1]==str[cnt]){
next[i++]=++cnt;
}else if(cnt>0){
cnt=next[cnt];
}else{
next[i++]=0;
}
}
return next;
}
完整代码
cpp
#include<iostream>
using namespace std;
int KMP(string str1,string str2,int *next){
int i=0,j=0;
while(i<str1.length()&&j<str2.length()){
if(str1[i]==str2[j]){
i++;
j++;
}else if(next[j]==-1){//j==0
i++;
}else{
j=next[j];
}
}
return j==str2.length()?i-j:-1;//只有j走到length才匹配否则不匹配
}
int* getnext(string str){
int *next=new int[str.length()];//只能动态申请空间否则函数结束会被释放
next[0]=-1;
next[1]=0;
int i=2,cnt=0;
while(i<str.length()){
if(str[i-1]==str[cnt]){
next[i++]=++cnt;
}else if(cnt>0){
cnt=next[cnt];
}else{
next[i++]=0;
}
}
return next;
}
int main(){
string str1="abcbnshdg";
string str2="nsh";
int *next=getnext(str2);
int location=KMP(str1,str2,next);
cout<<location;
}
本期对于KMP的代码分享至此,创作不易,大家多多支持!!