代码训练LeetCode(33)字符串首次匹配

代码训练(33)找出字符串中第一个匹配项的下标

Author: Once Day Date: 2025年6月13日

漫漫长路,才刚刚开始...

全系列文章可参考专栏: 十年代码训练_Once-Day的博客-CSDN博客

参考文章:

文章目录

1. 原题

给你两个字符串 haystackneedle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1

提示:

  • 1 <= haystack.length, needle.length <= 104
  • haystackneedle 仅由小写英文字符组成

示例 1:

yacas 复制代码
输入:haystack = "sadbutsad", needle = "sad"
输出:0
解释:"sad" 在下标 0 和 6 处匹配。
第一个匹配项的下标是 0 ,所以返回 0 。

示例 2:

yacas 复制代码
输入:haystack = "leetcode", needle = "leeto"
输出:-1
解释:"leeto" 没有在 "leetcode" 中出现,所以返回 -1 。
2. 分析

这个问题要求我们在一个字符串(haystack)中寻找另一个字符串(needle)的首次出现位置,并返回其索引。如果不存在,返回-1。这是一个经典的字符串搜索问题,常见于文本编辑器的查找功能中。

要解决这个问题,有几种方法:

  1. 暴力法:遍历haystack,对每一个起始位置,检查needle是否从该位置开始。
  2. KMP算法:一种更高效的字符串匹配算法,可以在不回溯haystack的情况下,通过预处理needle来实现快速匹配。
  3. Rabin-Karp算法:一种使用哈希技术的字符串搜索算法,适用于多模式搜索。
  4. Boyer-Moore算法:一种高效的单模式字符串搜索算法,利用坏字符规则和好后缀规则来跳过尽可能多的无效位置。

在这里,我们首先实现暴力方法,因为它易于理解和实现。接着,我们可以讨论KMP算法,它在实际应用中更为高效。

暴力法

  1. 遍历haystack中每一个可能的起始位置。
  2. 比较haystack中从当前位置开始的子串是否与needle相匹配。
  3. 如果匹配,返回当前索引。
  4. 如果遍历完所有可能的起始位置都没有找到匹配,返回-1。

KMP算法

  1. 预处理needle生成部分匹配表(也称为"pi"表或"prefix"表)。
  2. 使用该表来在不回溯haystack的情况下,有效地跳过needle中已知不匹配的部分。

性能优化关键点

  • 对于暴力法,性能瓶颈在于可能的冗余比较,特别是当needle较长且haystack较大时。
  • KMP算法通过预处理needle,避免不必要的比较,极大地提高效率。
3. 代码实现
c 复制代码
#include <stdio.h>
#include <string.h>

int strStr(char *haystack, char *needle) {
    int hLen = strlen(haystack);
    int nLen = strlen(needle);
    
    if (nLen == 0) return 0;
    
    for (int i = 0; i <= hLen - nLen; i++) {
        int j;
        for (j = 0; j < nLen; j++) {
            if (haystack[i + j] != needle[j]) {
                break;
            }
        }
        if (j == nLen) return i;
    }
    return -1;
}

int main() {
    char haystack[] = "sadbutsad";
    char needle[] = "sad";
    printf("Output: %d\n", strStr(haystack, needle));
    return 0;
}

代码解释:

  • strStr 函数通过双层循环实现暴力匹配。
  • 外层循环遍历haystack中的每个起始位置。
  • 内层循环检查needle是否在当前位置开始。
4. 总结

通过这个问题,我们可以学习和掌握字符串匹配的基本概念和方法。从简单的暴力法到更高级的KMP算法,我们可以看到算法优化如何显著提高程序的性能。对于初学者来说,理解不同算法的原理和实现是提升编程能力的重要步骤。

相关推荐
春日见3 小时前
丝滑快速拓展随机树 S-RRT(Smoothly RRT)算法核心原理与完整流程
人工智能·算法·机器学习·路径规划算法·s-rrt
Code小翊3 小时前
”回调“高级
算法·青少年编程
云里雾里!3 小时前
力扣 977. 有序数组的平方:双指针法的优雅解法
算法·leetcode·职场和发展
一只侯子6 小时前
Face AE Tuning
图像处理·笔记·学习·算法·计算机视觉
jianqiang.xue6 小时前
别把 Scratch 当 “动画玩具”!图形化编程是算法思维的最佳启蒙
人工智能·算法·青少年编程·机器人·少儿编程
不许哈哈哈7 小时前
Python数据结构
数据结构·算法·排序算法
J***79397 小时前
后端在分布式系统中的数据分片
算法·哈希算法
Dream it possible!8 小时前
LeetCode 面试经典 150_二叉搜索树_二叉搜索树中第 K 小的元素(86_230_C++_中等)
c++·leetcode·面试
sin_hielo9 小时前
leetcode 2872
数据结构·算法·leetcode
dragoooon349 小时前
[优选算法专题八.分治-归并 ——NO.49 翻转对]
算法