代码训练LeetCode(33)字符串首次匹配

代码训练(33)找出字符串中第一个匹配项的下标

Author: Once Day Date: 2025年6月13日

漫漫长路,才刚刚开始...

全系列文章可参考专栏: 十年代码训练_Once-Day的博客-CSDN博客

参考文章:

文章目录

1. 原题

给你两个字符串 haystackneedle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1

提示:

  • 1 <= haystack.length, needle.length <= 104
  • haystackneedle 仅由小写英文字符组成

示例 1:

yacas 复制代码
输入:haystack = "sadbutsad", needle = "sad"
输出:0
解释:"sad" 在下标 0 和 6 处匹配。
第一个匹配项的下标是 0 ,所以返回 0 。

示例 2:

yacas 复制代码
输入:haystack = "leetcode", needle = "leeto"
输出:-1
解释:"leeto" 没有在 "leetcode" 中出现,所以返回 -1 。
2. 分析

这个问题要求我们在一个字符串(haystack)中寻找另一个字符串(needle)的首次出现位置,并返回其索引。如果不存在,返回-1。这是一个经典的字符串搜索问题,常见于文本编辑器的查找功能中。

要解决这个问题,有几种方法:

  1. 暴力法:遍历haystack,对每一个起始位置,检查needle是否从该位置开始。
  2. KMP算法:一种更高效的字符串匹配算法,可以在不回溯haystack的情况下,通过预处理needle来实现快速匹配。
  3. Rabin-Karp算法:一种使用哈希技术的字符串搜索算法,适用于多模式搜索。
  4. Boyer-Moore算法:一种高效的单模式字符串搜索算法,利用坏字符规则和好后缀规则来跳过尽可能多的无效位置。

在这里,我们首先实现暴力方法,因为它易于理解和实现。接着,我们可以讨论KMP算法,它在实际应用中更为高效。

暴力法

  1. 遍历haystack中每一个可能的起始位置。
  2. 比较haystack中从当前位置开始的子串是否与needle相匹配。
  3. 如果匹配,返回当前索引。
  4. 如果遍历完所有可能的起始位置都没有找到匹配,返回-1。

KMP算法

  1. 预处理needle生成部分匹配表(也称为"pi"表或"prefix"表)。
  2. 使用该表来在不回溯haystack的情况下,有效地跳过needle中已知不匹配的部分。

性能优化关键点

  • 对于暴力法,性能瓶颈在于可能的冗余比较,特别是当needle较长且haystack较大时。
  • KMP算法通过预处理needle,避免不必要的比较,极大地提高效率。
3. 代码实现
c 复制代码
#include <stdio.h>
#include <string.h>

int strStr(char *haystack, char *needle) {
    int hLen = strlen(haystack);
    int nLen = strlen(needle);
    
    if (nLen == 0) return 0;
    
    for (int i = 0; i <= hLen - nLen; i++) {
        int j;
        for (j = 0; j < nLen; j++) {
            if (haystack[i + j] != needle[j]) {
                break;
            }
        }
        if (j == nLen) return i;
    }
    return -1;
}

int main() {
    char haystack[] = "sadbutsad";
    char needle[] = "sad";
    printf("Output: %d\n", strStr(haystack, needle));
    return 0;
}

代码解释:

  • strStr 函数通过双层循环实现暴力匹配。
  • 外层循环遍历haystack中的每个起始位置。
  • 内层循环检查needle是否在当前位置开始。
4. 总结

通过这个问题,我们可以学习和掌握字符串匹配的基本概念和方法。从简单的暴力法到更高级的KMP算法,我们可以看到算法优化如何显著提高程序的性能。对于初学者来说,理解不同算法的原理和实现是提升编程能力的重要步骤。

相关推荐
PAK向日葵4 小时前
【算法导论】PDD 0817笔试题题解
算法·面试
地平线开发者7 小时前
ReID/OSNet 算法模型量化转换实践
算法·自动驾驶
地平线开发者7 小时前
开发者说|EmbodiedGen:为具身智能打造可交互3D世界生成引擎
算法·自动驾驶
星星火柴9368 小时前
关于“双指针法“的总结
数据结构·c++·笔记·学习·算法
艾莉丝努力练剑9 小时前
【洛谷刷题】用C语言和C++做一些入门题,练习洛谷IDE模式:分支机构(一)
c语言·开发语言·数据结构·c++·学习·算法
C++、Java和Python的菜鸟10 小时前
第六章 统计初步
算法·机器学习·概率论
Cx330❀10 小时前
【数据结构初阶】--排序(五):计数排序,排序算法复杂度对比和稳定性分析
c语言·数据结构·经验分享·笔记·算法·排序算法
散11210 小时前
01数据结构-Prim算法
数据结构·算法·图论
起个昵称吧11 小时前
线程相关编程、线程间通信、互斥锁
linux·算法
myzzb11 小时前
基于uiautomation的自动化流程RPA开源开发演示
运维·python·学习·算法·自动化·rpa