KMP算法

大家好,今天给大家带来KMP算法的讲解。

问题描述

KMP是用来干嘛的-KMP是用来找字符串str1中是否有字符串str2。我们知道暴力算法实现该问题时是逐个匹配:从str1的0位置开始匹配,如果0位置字符和str2的0位置字符相同,则指针同时后移,继续匹配。若不相同,则str2指针归零,继续匹配。KMP算法可以对此实现加速,具体细节听我细细道来。

KMP算法细节

next数组

next数组是用来干嘛的?是用来记录str2每个位置前面的字符串前缀和后缀的最大公共长度。举个例子:str2="abastzabast"。

i=0时,其前名无字符串,人为设定为-1,即next【0】=-1。i=1时,其前名字符串为a,由于前缀和后缀均不能为字符串本身,因此next【1】=0。当i=2时,前面字符串为ab,前缀为:a,后缀为:b,无公共部分,next【2】=0。当i=3时,其前面字符串为aba,前缀为:a,ab。后缀为:a,ba。最大公共长度为1(a),因此next【3】=1。同理其它位置,如next【10】,即t位置处,其前面字符串为abastzaba,最大公共部分为:aba,因此next【10】=3。

有了next数组的概念,我们就可以进行KMP算法的讲解了。

KMP分析

因此我们可以判断:当str1和str2出现不匹配现象时,用于str2遍历的元素j变为next【j】,相当于前缀替换掉原来的后缀,重新匹配。当j=0时,next【0】=-1,也就说明:str2从开始位置0与str1进行匹配也无法匹配,此时需要负责str1遍历的指针i++ 。当str1和str2某个位置匹配时:只需i++,j++即可。当j=str2.length()时,说明匹配成功返回i-j,否则返回-1(未成功匹配)。这是因为只有某个位置匹配时j才会增大1,当其为str2.length()时,说明匹配成功str2.length()次,即完全匹配。

KMP代码细节

cpp 复制代码
int KMP(string str1,string str2,int *next){
	int i=0,j=0;
	while(i<str1.length()&&j<str2.length()){
		if(str1[i]==str2[j]){
			i++;
			j++;
		}else if(next[j]==-1){//j==0
			i++;
		}else{
			j=next[j];
		}
	}
	return j==str2.length()?i-j:-1;//只有j走到length才匹配否则不匹配 
}

next数组求解代码

上述KMP代码需要用到next数组,我们只讲了next数组含义,那如何求解呢?首先我们应该知道,next【0】=-1,next【1】=0这是肯定的。

我们要求next【i】,就要查看i-1位置和cnt位置处元素是否相等(cnt为next【i-1】),如果相等则next【i】=next【i-1】+1=cnt+1。不想等,则让cnt=next【cnt】,重复操作。当cnt=0时,仍然不相等那么next【i】=0。(首尾元素都不相等不可能有公共前后缀部分)

cpp 复制代码
int* getnext(string str){
	int *next=new int[str.length()];//只能动态申请空间否则函数结束会被释放 
	next[0]=-1;
	next[1]=0;
	int i=2,cnt=0;
	while(i<str.length()){
		if(str[i-1]==str[cnt]){
			next[i++]=++cnt;
		}else if(cnt>0){
			cnt=next[cnt];
		}else{
			next[i++]=0;
		}
	}
	return next;
}

完整代码

cpp 复制代码
#include<iostream>
using namespace std;
int KMP(string str1,string str2,int *next){
	int i=0,j=0;
	while(i<str1.length()&&j<str2.length()){
		if(str1[i]==str2[j]){
			i++;
			j++;
		}else if(next[j]==-1){//j==0
			i++;
		}else{
			j=next[j];
		}
	}
	return j==str2.length()?i-j:-1;//只有j走到length才匹配否则不匹配 
}
int* getnext(string str){
	int *next=new int[str.length()];//只能动态申请空间否则函数结束会被释放 
	next[0]=-1;
	next[1]=0;
	int i=2,cnt=0;
	while(i<str.length()){
		if(str[i-1]==str[cnt]){
			next[i++]=++cnt;
		}else if(cnt>0){
			cnt=next[cnt];
		}else{
			next[i++]=0;
		}
	}
	return next;
}
int main(){
	string str1="abcbnshdg";
	string str2="nsh";
	int *next=getnext(str2);
	int location=KMP(str1,str2,next);
	cout<<location;
} 

本期对于KMP的代码分享至此,创作不易,大家多多支持!!

相关推荐
痴儿哈哈8 分钟前
C++与硬件交互编程
开发语言·c++·算法
小O的算法实验室15 分钟前
2024年ESWA SCI1区TOP,异构无人机配送问题的集成多目标优化方法,深度解析+性能实测
算法·论文复现·智能算法·智能算法改进
日拱一卒——功不唐捐21 分钟前
循环队列+双端队列(C语言)
c语言·数据结构
草履虫建模22 分钟前
力扣算法 121. 买卖股票的最佳时机
算法·leetcode·职场和发展·贪心算法·动态规划·一次遍历
养军博客23 分钟前
C语言五天速成(可用于蓝桥杯备考 难度中等偏下)
c语言·算法·蓝桥杯
爱尔兰极光26 分钟前
LeetCode--有序数组的平方
算法·leetcode·职场和发展
hnjzsyjyj28 分钟前
洛谷 P3383:线性筛素数 ← 埃氏筛
数据结构·埃氏筛
jay神28 分钟前
森林火灾检测数据集
算法·机器学习·目标跟踪
80530单词突击赢42 分钟前
STLVector底层原理与高效运用
数据结构·算法
haluhalu.1 小时前
LeetCode---基础算法刷题指南
数据结构·算法·leetcode