代码训练LeetCode(33)字符串首次匹配

代码训练(33)找出字符串中第一个匹配项的下标

Author: Once Day Date: 2025年6月13日

漫漫长路,才刚刚开始...

全系列文章可参考专栏: 十年代码训练_Once-Day的博客-CSDN博客

参考文章:

文章目录

1. 原题

给你两个字符串 haystackneedle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1

提示:

  • 1 <= haystack.length, needle.length <= 104
  • haystackneedle 仅由小写英文字符组成

示例 1:

yacas 复制代码
输入:haystack = "sadbutsad", needle = "sad"
输出:0
解释:"sad" 在下标 0 和 6 处匹配。
第一个匹配项的下标是 0 ,所以返回 0 。

示例 2:

yacas 复制代码
输入:haystack = "leetcode", needle = "leeto"
输出:-1
解释:"leeto" 没有在 "leetcode" 中出现,所以返回 -1 。
2. 分析

这个问题要求我们在一个字符串(haystack)中寻找另一个字符串(needle)的首次出现位置,并返回其索引。如果不存在,返回-1。这是一个经典的字符串搜索问题,常见于文本编辑器的查找功能中。

要解决这个问题,有几种方法:

  1. 暴力法:遍历haystack,对每一个起始位置,检查needle是否从该位置开始。
  2. KMP算法:一种更高效的字符串匹配算法,可以在不回溯haystack的情况下,通过预处理needle来实现快速匹配。
  3. Rabin-Karp算法:一种使用哈希技术的字符串搜索算法,适用于多模式搜索。
  4. Boyer-Moore算法:一种高效的单模式字符串搜索算法,利用坏字符规则和好后缀规则来跳过尽可能多的无效位置。

在这里,我们首先实现暴力方法,因为它易于理解和实现。接着,我们可以讨论KMP算法,它在实际应用中更为高效。

暴力法

  1. 遍历haystack中每一个可能的起始位置。
  2. 比较haystack中从当前位置开始的子串是否与needle相匹配。
  3. 如果匹配,返回当前索引。
  4. 如果遍历完所有可能的起始位置都没有找到匹配,返回-1。

KMP算法

  1. 预处理needle生成部分匹配表(也称为"pi"表或"prefix"表)。
  2. 使用该表来在不回溯haystack的情况下,有效地跳过needle中已知不匹配的部分。

性能优化关键点

  • 对于暴力法,性能瓶颈在于可能的冗余比较,特别是当needle较长且haystack较大时。
  • KMP算法通过预处理needle,避免不必要的比较,极大地提高效率。
3. 代码实现
c 复制代码
#include <stdio.h>
#include <string.h>

int strStr(char *haystack, char *needle) {
    int hLen = strlen(haystack);
    int nLen = strlen(needle);
    
    if (nLen == 0) return 0;
    
    for (int i = 0; i <= hLen - nLen; i++) {
        int j;
        for (j = 0; j < nLen; j++) {
            if (haystack[i + j] != needle[j]) {
                break;
            }
        }
        if (j == nLen) return i;
    }
    return -1;
}

int main() {
    char haystack[] = "sadbutsad";
    char needle[] = "sad";
    printf("Output: %d\n", strStr(haystack, needle));
    return 0;
}

代码解释:

  • strStr 函数通过双层循环实现暴力匹配。
  • 外层循环遍历haystack中的每个起始位置。
  • 内层循环检查needle是否在当前位置开始。
4. 总结

通过这个问题,我们可以学习和掌握字符串匹配的基本概念和方法。从简单的暴力法到更高级的KMP算法,我们可以看到算法优化如何显著提高程序的性能。对于初学者来说,理解不同算法的原理和实现是提升编程能力的重要步骤。

相关推荐
KyollBM16 分钟前
【Luogu】每日一题——Day15. P1144 最短路计数 (记忆化搜索 + 图论 + 最短路)
算法·图论
一百天成为python专家24 分钟前
K-近邻算法
数据结构·python·算法·pandas·近邻算法·ipython·python3.11
满分观察网友z42 分钟前
告别烦人的“三连发”:我的智能评论系统过滤之旅(1957. 删除字符使字符串变好)
算法
小新学习屋44 分钟前
《剑指offer》-数据结构篇-哈希表/数组/矩阵/字符串
数据结构·leetcode·哈希表
满分观察网友z1 小时前
滑动窗口下的极限挑战:我在实时数据流中挖掘最大价值分(1695. 删除子数组的最大得分)
算法
山烛1 小时前
KNN 算法中的各种距离:从原理到应用
人工智能·python·算法·机器学习·knn·k近邻算法·距离公式
guozhetao1 小时前
【ST表、倍增】P7167 [eJOI 2020] Fountain (Day1)
java·c++·python·算法·leetcode·深度优先·图论
吃着火锅x唱着歌1 小时前
LeetCode 611.有效三角形的个数
算法·leetcode·职场和发展
技术卷1 小时前
详解力扣高频SQL50题之619. 只出现一次的最大数字【简单】
sql·leetcode·oracle
CHANG_THE_WORLD4 小时前
金字塔降低采样
算法·金字塔采样