【数据结构】考研真题攻克与重点知识点剖析 - 第 4 篇:串

前言

  • 本文基础知识部分来自于b站:分享笔记的好人儿的思维导图与王道考研课程,感谢大佬的开源精神,习题来自老师划的重点以及考研真题。
  • 此前我尝试了完全使用Python或是结合大语言模型对考研真题进行数据清洗与可视化分析,本人技术有限,最终数据清洗结果不够理想,相关CSDN文章便没有发出。

(考研真题待更新)

欢迎订阅专栏:408直通车
请注意,本文中的部分内容来自网络搜集和个人实践,如有任何错误,请随时向我们提出批评和指正。本文仅供学习和交流使用,不涉及任何商业目的。如果因本文内容引发版权或侵权问题,请通过私信告知我们,我们将立即予以删除。

文章目录

第四章 串

串的定义与实现

概念

  • 串的概念

    • 零个或多个任意字符组成的有限序列(内容受限的线性表)
  • 子串的概念

    • 一个串中任意个连续字符组成的子序列(含空串)




小结

串的存储结构(和线性表几乎一样,仅将存储数据的类型改为字符)

顺序存储结构


char 8bit 0~255

链式存储结构


  • 一个结点若只存一个字符,存储密度过低,引出块链存储结构

小结
块链存储结构
  • 每个结点既可以存放一个字符,也可以存放多个字符。每个结点称为块

串的模式匹配

简单模式匹配算法

  • 概念

    • 子串的定位操作通常称为串的模式匹配,它求的是子串(模式串)在主串中的位置
  • 算法思想

    • 将主串中与模式串长度相同的子串逐个与模式串匹配,暴力法

  • 缺点

    • 主串指针回溯导致时间开销,时间复杂度为:O(nm),nm分别为主串和模式串的长度

KMP算法

  • 基本概念

    • 前缀

      • 除最后一个字符外,字符串的所有头部子串
    • 后缀

      • 除第一个字符外,字符串的所有尾部子串
  • 算法思想

    • 主串指针不必回溯,模式串指针根据next数组部分回溯(如果已匹配相等的前缀序列中有某个后缀正好是模式的前缀,可以将模式串向后滑动到与这些相等字符对齐的位置)
  • next数组

    • 表明当模式中第j个字符与主串中相应字符匹配失败时,在模式中需重新和主串中该字符进行比较的字符位置

      • 即衡量模式串向后滑动的量
    • 计算

        • 以"abab"为例

          • 序号j = 1时,属于j == 1情况,next[j] = 0

          • 序号j = 2时,'a'的前后缀都为空集,属于其他情况,next[j] = 1

          • 序号j = 3时,'ab'的前缀为{a},后缀为{b},交集为空,属于其他情况,next[j] = 1

          • 序号j = 4时,'aba'的前缀为{a,ab},后缀为{a,ba},交集为{a},k - 1 = 1(长度),next[j] = k = 2(长度+1)

  • 时间复杂度:O(m + n)

手算
  • 1

  • 2

  • 3

  • 4

  • 5

  • 6



进一步优化

  • 构造nextval数组
      • 若模式串指向的位置的字符等于本身,可以直接赋值

      • 举例

        • 5号的a中next数组指向3号位置,3号位置也是a故直接把3号的next数组值复制过去

        • 6号的a中next数组指向4号位置,两者字符不同,不能优化

代码



王道代码见教材

补充代码

cpp 复制代码
cin >> n >> p+1 >> m >> s+1;// char数组s是长文本,p是模式串,且从数组下标1开始存储
for(int i=2,j=0;i<=n;i++){  //求next数组
    while(j&&p[i]!=p[j+1]) j=ne[j];
    if(p[i]==p[j+1]) j++;
    ne[i]=j;
}
for(int i=1,j=0;i<=m;i++){  //匹配
    while(j&&s[i]!=p[j+1]) j=ne[j];
    if(s[i]==p[j+1]) j++;
    if(j==n){
        j=ne[j];
        //匹配成功
    }
}

考研真题

408 - 2023

(考研真题待更新)

相关推荐
养成系小王2 小时前
四大常用排序算法
数据结构·算法·排序算法
闪电麦坤953 小时前
数据结构:从前序遍历序列重建一棵二叉搜索树 (Generating from Preorder)
数据结构··二叉搜索树
闪电麦坤953 小时前
数据结构:二叉树的遍历 (Binary Tree Traversals)
数据结构·二叉树·
球king3 小时前
数据结构中邻接矩阵中的无向图和有向图
数据结构
野渡拾光5 小时前
【考研408数据结构-05】 串与KMP算法:模式匹配的艺术
数据结构·考研·算法
pusue_the_sun13 小时前
数据结构:二叉树oj练习
c语言·数据结构·算法·二叉树
liang_jy18 小时前
数组(Array)
数据结构·面试·trae
要做朋鱼燕19 小时前
【数据结构】用堆解决TOPK问题
数据结构·算法
秋难降20 小时前
LRU缓存算法(最近最少使用算法)——工业界缓存淘汰策略的 “默认选择”
数据结构·python·算法
Jayyih1 天前
嵌入式系统学习Day19(数据结构)
数据结构·学习