【力扣-KMP】28.找出字符串第一个匹配项的下标

问题描述

思路解析

使用KMP算法,KMP算法的优点在于

  • 原串不需要回溯,可以继续往前不断执行
  • 匹配的子串,可以通过next[]数组来减少从零开始匹配的次数,会从有相同前后缀的地方开始重新匹配

KMP的关键点就在于如何构建next[]数组

构造方法为:next[i] 对应的下标,为 P[0...i - 1] 的最长公共前缀后缀的长度,令 next[0] = -1。 具体解释如下:

例如对于字符串 abcba:

前缀:它的前缀包括:a, ab, abc, abcb,不包括本身;

后缀:它的后缀包括:bcba, cba, ba, a,不包括本身;

最长公共前缀后缀:abcba 的前缀和后缀中只有 a 是公共部分,字符串 a 的长度为 1。

所以,我们将 P[0...i - 1] 的最长公共前后缀的长度作为 next[i] 的下标,就得到了 next 数组。

关于构造next数组我觉得有几个需要注意的点

  • next【0】=-1
    • 这是因为对于构造next【】数组,其实就是子串自身的相同子串的查找,那么也是可以类似递归使用next数组的,对于字符串不匹配的情况下,我们会让 i=next[i](i是相当于子串的自身匹配串的下标),如果next[0]=0的话,那么会不断重复这一点,导致死循环。所以让 next[0]=-1,这样只要在进行比较的while循环进行特判就好了
  • i=next[i]
    • 当子串的字符串不匹配的时候,也可以使用next数组来减少匹配的项数,如果存在公共前后缀的话,那么就可以不用重头匹配,而是在之前的next 下标处开始匹配。

代码

java 复制代码
class Solution {
    public int strStr(String haystack, String needle) {
        int m=haystack.length(),i=0;
        int n=needle.length(),j=0;
        int []next=newNext(needle);

        while(i<m&&j<n){
            if(j<0||haystack.charAt(i)==needle.charAt(j)){
                i++;j++;
            }else{
                j=next[j];
            }
        }
        if(j==n) return i-j;
        return -1;
    }

    //这个构造next数组的过程,类比于对于匹配数组自身进行字符串匹配
    
    private  int[] newNext(String needle){
        int len=needle.length();
        int[]next=new int[len];
        next[0]=-1;
        int i=-1,j=0;
        while(j<len-1){
            if(i==-1||needle.charAt(i)==needle.charAt(j)){
                i++;  j++;
                next[j]=i;
            }
            else{
                i=next[i];
            }
        }
        return next;
    }
}
相关推荐
LucaJu几秒前
Java + EasyExcel 实现单个接口导出多个Excel
java·excel
橘子编程9 分钟前
密码学完全指南:从基础到实战
java·python·密码学
计算机安禾11 分钟前
【数据结构与算法】第44篇:堆(Heap)的实现
c语言·开发语言·数据结构·c++·算法·排序算法·图论
kaikaile199514 分钟前
能量算子的MATLAB实现与详细算法
人工智能·算法·matlab
tankeven17 分钟前
HJ175 小红的整数配对
c++·算法
J2虾虾21 分钟前
使用Idea当Jar包的反编译
java·intellij-idea·jar
Aaron158822 分钟前
数字波束合成DBF与模拟波束合成ABF对比浅析
大数据·人工智能·算法·硬件架构·硬件工程·信息与通信·信号处理
成都易yisdong24 分钟前
实现三北方向转换计算器(集成 WMM2025 地磁模型)
开发语言·windows·算法·c#·visual studio
汀、人工智能25 分钟前
[特殊字符] 第91课:课程表
数据结构·算法·数据库架构·图论·bfs·课程表
白露与泡影29 分钟前
2026 全新 Java 面试题汇总(含答案)
java·开发语言