4.2 串的模式匹配
4.2.1 简单的模式匹配算法
子串的定位操作通常称为串的模式匹配,它求的是子串(常称模式串)在主串中的位置。这里采用定长顺序存储结构,给出一种不依赖于其他串操作的暴力匹配算法。
cpp
int Index(SString s,SString T){
int i=1,j=1;
while(i<=S.length && j<=T.length){
if(S.ch[i]==T.ch[j]){
++i;++j //继续比较后继字符
}
else{
i=i-j+2;j=1; //指针后退重新开始匹配
}
if(j>T.length)return i-T.length;
else return 0;
}
在上述算法中,分别用计数指针i和j指示主串s和模式串T中当前正待比较的字符位置。算法思想为:从主串s的第一个字符起,与模式串T的第一个字符比较,若相等,则继续逐个比较后续字符;否则从主串的下一个字符起,重新和模式串的字符比较;以此类推,直至模式串 T中的每个字符依次和主串s中的一个连续的字符序列相等,则称匹配成功,函数值为与模式串 T中第一个字符相等的字符在主串S中的序号,否则称匹配不成功,函数值为零。图 4.2 展示了模式串 T='abcac`和主串 s 的匹配过程,每次匹配失败后,都把模式串T后移一位。
简单模式匹配算法的最坏时间复杂度为O(nm),其中n和m分别为主串和模式串的长度。例如,当模式串为'0000001'而主串为'O000000000000000000000000000000000000000 000001'时,由于模式串中的前6个字符均为'0',主串中的前45个字符均为'0',每趟匹配都是比较到模式串中的最后一个字符时才发现不等,指针i需要回溯39次,总比较次数为40x7=280次。
4.2.2 串的模式匹配算法------KMP算法
这里推荐代码随想录对KMP算法的讲解:帮你把KMP算法学个通透!(理论篇)_哔哩哔哩_bilibili