《LeetCode力扣练习》代码随想录——字符串(KMP算法学习补充——针对next数组构建的回退步骤进行解释)

《LeetCode力扣练习》代码随想录------字符串(KMP算法学习补充------针对next数组构建的回退步骤进行解释)



学习路径
代码随想录:28. 实现 strStr()
CSDN:【详解】KMP算法------多图,多例子(c语言)
个人补充
看了以上学习路径后,对于KMP有了很深的认识,但是两位作者都没有提到一个重要的步骤的原因------构造next数组时 k=next[k]; // 向前回退 这一步骤的原因和思想。其实这一步我认为是KMP的精髓所在,也是KMP思想的体现,所以在理解之后,将想法记录下来,方便回顾。
个人理解KMP的精髓是:不要浪费。已经匹配过的字符串就算遇到不匹配的字符也不要浪费,还有利用的空间,有点像剥削了...
CSDN文章中,构造next数组的时候,当遇到不匹配的字符时,需要向前回退的例子还是过于特殊,导致回退一次就可以匹配上,这里我又重新构造了新的字符串:
分别是求next[6]和next[8]的值。
在构建next数组的时候,同时也运用到了KMP算法,并不是在搜寻字符串的时候才运用到,有点递归的感觉
以第二个next为例,当根据之前的最长相等前后缀aba、aba无法直接求得更长的前后缀时(b!=c,否则可以直接构成abac、abac了,直接赋值4),这时候不能直接放弃,还没有榨干之前字符串的价值,我们需要跳转 k=next[k];
重点来了,为什么要跳转到next[k]呢?
aba、aba是两个最长相等前后缀,同时他们自己也有自己的最长相等前后缀。并且第一个aba的最长相等前缀和第二个aba的最长相等后缀(因为两个字符串是相等的)这一点很重要!!!
next[k]还有一层含义:阻止当前的最大相等前后缀成长为更长的相等前后缀的字符,也就是说这个字符阻止了更长的最大相等字符串的出现!!!
当第一个next[k]匹配失败后,我们跳到第二个next[k],组织第一个aba的最长相等前后缀a变得更长的字符b的位置,因为上面所说的,我要尝试一下第一个aba的前缀+阻止字符和第二个aba的后缀+当前字符next[7]对应的b能否组成一对最长相等前后缀,这样的话(aba、aba这一对就没有被浪费,还可以利用他们本身的前后缀再次查找,并且由于这一对本身没有成功,所以他们的字串如果成功的话必然是最大的相等前后缀)
总结一下,这个回退的操作有点像二分法的感觉,第一个前后缀不行,就把他们分开,看前缀的前缀+阻止字符和后缀的后缀+新匹配的字符 能否构成新的前后缀,如果还不行就在回退,再一分为二,一直到第一个字符都不行,next[k]为-1,就代表着一点都不一样,赋值为0,表示没有了。
构建next数组和字符串匹配都用到了KMP,区别是什么呢?next是用前缀的前缀去匹配后缀的后缀;字符串匹配是前缀不行,换前缀的前缀上,不行的话再试。两个操作基本一样,但是next在于写入值,字符串匹配在于移动。
到这里我个人的解释就结束了,我是自己把这里想明白之后,KMP算法就顿悟了,没想明白之前,每次回退都十分忐忑。
我的具体实现代码在这里:《LeetCode力扣练习》代码随想录------字符串(实现 strStr()---Java)

相关推荐
Mr.Jessy4 分钟前
Web APIs 学习第六天:BOM、location对象与本地存储
开发语言·前端·javascript·学习·web api·bom
_fairyland6 分钟前
数据结构 力扣 练习
数据结构·考研·算法·leetcode
Neil今天也要学习24 分钟前
永磁同步电机无速度算法--基于三阶LESO的反电动势观测器
算法·1024程序员节
机器学习之心34 分钟前
NGO-VMD北方苍鹰算法优化变分模态分解+皮尔逊系数+小波阈值降噪+信号重构,MATLAB代码
算法·matlab·重构·信号重构·ngo-vmd·皮尔逊系数·小波阈值降噪
橘颂TA38 分钟前
【剑斩OFFER】算法的暴力美学——山脉数组的蜂顶索引
算法·leetcode·职场和发展·c/c++
速易达网络1 小时前
C语言常见推理题
java·c语言·算法
呜呜。1 小时前
WebSocket-学习调研
websocket·网络协议·学习
freedom_1024_1 小时前
LRU缓存淘汰算法详解与C++实现
c++·算法·缓存
Tonya431 小时前
测开学习DAY28
学习
博语小屋1 小时前
力扣11.盛水最多的容器(medium)
算法·leetcode·职场和发展