关键词查找【Knuth-Morris-Pratt (KMP) 算法】

一个视频让你彻底学懂KMP算法_哔哩哔哩_bilibili

KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。

第一步:计算模式串(子串)和next[j]数组

模式串 前2位字母的next[j]固定是0 和 1

后续字母的nex[j],aba 里的第三位的next[j] =首尾相同子字符串长度+1,ab首尾相同子字符串长度为0

后续字母的nex[j],abaa 里的第四位的next[j] =首尾相同子字符串长度+1,aba首尾相同子字符串(a)长度为1

后续字母的nex[j],abaab 里的第五位的next[j] =首尾相同子字符串长度+1,abaa首尾相同子字符串(a)长度为1

后续字母的nex[j],abaabc 里的第六位的next[j] =首尾相同子字符串长度+1,abaaab首尾相同子字符串(ab)长度为2

第六位第七位 以此类推。。。

第二步:主串和子串比对过程中遇到不匹配字母时,用子串里不匹配的字母去数组里找 next[j]

下图:c和b不匹配,用b去数组里找到nex[j]=1,图二j挪到第一位,继续比较

下图:c和a不匹配,用a去数组里找到nex[j]=0,图二j挪到第0位,然后i和j 都往后移一位继续比较

下图:a和c不匹配,用c去数组里找到nex[j]=3,图二j挪到第3位,继续比较

实现代码如下:

java 复制代码
public class KMP {
     
    // 计算部分匹配表 (LPS)
    private static int[] computeLPSArray(String pattern) {
        int[] lps = new int[pattern.length()];
        int length = 0; // 长度为当前最长前缀后缀
        int i = 1;
 
        while (i < pattern.length()) {
            if (pattern.charAt(i) == pattern.charAt(length)) {
                length++;
                lps[i] = length;
                i++;
            } else {
                if (length != 0) {
                    length = lps[length - 1]; // 回溯
                } else {
                    lps[i] = 0;
                    i++;
                }
            }
        }
        return lps;
    }
 
    // KMP 查找算法
    public static boolean kmpSearch(String text, String pattern) {
        int[] lps = computeLPSArray(pattern);
        int i = 0; // 文本的索引
        int j = 0; // 模式串的索引
 
        while (i < text.length()) {
            if (pattern.charAt(j) == text.charAt(i)) {
                i++;
                j++;
            }
 
            if (j == pattern.length()) {
                return true; // 找到匹配
            } else if (i < text.length() && pattern.charAt(j) != text.charAt(i)) {
                if (j != 0) {
                    j = lps[j - 1]; // 根据 LPS 表回溯
                } else {
                    i++;
                }
            }
        }
        return false; // 未找到匹配
    }
 
    public static void main(String[] args) {
        String text = "aaaaaaac";
        String pattern = "aaaac";
 
        boolean found = kmpSearch(text, pattern);
        if (found) {
            System.out.println("子串 \"" + pattern + "\" 在主串中出现过。");
        } else {
            System.out.println("子串 \"" + pattern + "\" 在主串中未出现。");
        }
    }
}

相关:

https://blog.csdn.net/qq_43197840/article/details/140680621?spm=1001.2014.3001.5501

https://blog.csdn.net/qq_43197840/article/details/140679425?spm=1001.2014.3001.5501

相关推荐
潇凝子潇2 分钟前
在 Maven 中跳过单元测试进行本地打包或排除某个项目进行打包
java·单元测试·maven
weixin_462446232 分钟前
Java 使用 Apache Batik 将 SVG 转换为 PNG(指定宽高)
java·apache·svg转png
移幻漂流3 分钟前
Kotlin 完全取代 Java:一场渐进式的技术革命(技术、成本与综合评估)
java·开发语言·kotlin
WF_YL6 分钟前
极光推送(JPush)快速上手教程(Java 后端 + 全平台适配)
java·开发语言
格林威7 分钟前
多相机重叠视场目标关联:解决ID跳变与重复计数的 8 个核心策略,附 OpenCV+Halcon 实战代码!
人工智能·数码相机·opencv·算法·计算机视觉·分类·工业相机
郝学胜-神的一滴9 分钟前
深入理解网络分层模型:数据封包与解包全解析
linux·开发语言·网络·程序人生·算法
永远都不秃头的程序员(互关)9 分钟前
【K-Means深度探索(九)】K-Means与数据预处理:特征缩放与降维的重要性!
算法·机器学习·kmeans
CHU7290359 分钟前
智慧回收新体验:同城废品回收小程序的便捷功能探索
java·前端·人工智能·小程序·php
派大鑫wink10 分钟前
【Day42】SpringMVC 入门:DispatcherServlet 与请求映射
java·开发语言·mvc
填满你的记忆14 分钟前
【计算机网络·基础篇】TCP 的“三次握手”与“四次挥手”:后端面试的“生死线”
java·网络·网络协议·tcp/ip·计算机网络·面试