【力扣-KMP】28.找出字符串第一个匹配项的下标

问题描述

思路解析

使用KMP算法,KMP算法的优点在于

  • 原串不需要回溯,可以继续往前不断执行
  • 匹配的子串,可以通过next\[\]数组来减少从零开始匹配的次数,会从有相同前后缀的地方开始重新匹配

KMP的关键点就在于如何构建next\[\]数组

构造方法为:nexti 对应的下标,为 P0...i - 1 的最长公共前缀后缀的长度,令 next0 = -1。 具体解释如下:

例如对于字符串 abcba:

前缀:它的前缀包括:a, ab, abc, abcb,不包括本身;

后缀:它的后缀包括:bcba, cba, ba, a,不包括本身;

最长公共前缀后缀:abcba 的前缀和后缀中只有 a 是公共部分,字符串 a 的长度为 1。

所以,我们将 P0...i - 1 的最长公共前后缀的长度作为 nexti 的下标,就得到了 next 数组。

关于构造next数组我觉得有几个需要注意的点

  • next【0】=-1
    • 这是因为对于构造next【】数组,其实就是子串自身的相同子串的查找,那么也是可以类似递归使用next数组的,对于字符串不匹配的情况下,我们会让 i=nexti(i是相当于子串的自身匹配串的下标),如果next0=0的话,那么会不断重复这一点,导致死循环。所以让 next0=-1,这样只要在进行比较的while循环进行特判就好了
  • i=nexti
    • 当子串的字符串不匹配的时候,也可以使用next数组来减少匹配的项数,如果存在公共前后缀的话,那么就可以不用重头匹配,而是在之前的next 下标处开始匹配。

代码

java 复制代码
class Solution {
    public int strStr(String haystack, String needle) {
        int m=haystack.length(),i=0;
        int n=needle.length(),j=0;
        int []next=newNext(needle);

        while(i<m&&j<n){
            if(j<0||haystack.charAt(i)==needle.charAt(j)){
                i++;j++;
            }else{
                j=next[j];
            }
        }
        if(j==n) return i-j;
        return -1;
    }

    //这个构造next数组的过程,类比于对于匹配数组自身进行字符串匹配
    
    private  int[] newNext(String needle){
        int len=needle.length();
        int[]next=new int[len];
        next[0]=-1;
        int i=-1,j=0;
        while(j<len-1){
            if(i==-1||needle.charAt(i)==needle.charAt(j)){
                i++;  j++;
                next[j]=i;
            }
            else{
                i=next[i];
            }
        }
        return next;
    }
}
相关推荐
二月夜10 小时前
剖析Java正则表达式回溯问题
java·正则表达式
xuhaoyu_cpp_java11 小时前
项目学习(三)分页查询
java·经验分享·笔记·学习
程序员二叉11 小时前
【Java】集合面试全套精讲|HashMap/ArrayList高频考点完整版
java·面试·哈希算法
cfm_291412 小时前
JVM GC垃圾回收初步了解
java·开发语言·jvm
心之伊始12 小时前
LangChain4j RAG 实战:Java 后端如何把本地文档接入 Embedding 检索链路
java·架构·源码分析·csdn
许彰午12 小时前
17_synchronized关键字深度解析
java·开发语言
小宋加油啊13 小时前
机械臂抓取物体 PVN3D算法调研学习
学习·算法·3d
lqqjuly13 小时前
前沿算法深度解析(一)
算法
小欣加油13 小时前
leetcode1926 迷宫中离入口最近的出口
数据结构·c++·算法·leetcode·职场和发展