【数据结构】考研真题攻克与重点知识点剖析 - 第 4 篇:串

前言

  • 本文基础知识部分来自于b站:分享笔记的好人儿的思维导图与王道考研课程,感谢大佬的开源精神,习题来自老师划的重点以及考研真题。
  • 此前我尝试了完全使用Python或是结合大语言模型对考研真题进行数据清洗与可视化分析,本人技术有限,最终数据清洗结果不够理想,相关CSDN文章便没有发出。

(考研真题待更新)

欢迎订阅专栏:408直通车
请注意,本文中的部分内容来自网络搜集和个人实践,如有任何错误,请随时向我们提出批评和指正。本文仅供学习和交流使用,不涉及任何商业目的。如果因本文内容引发版权或侵权问题,请通过私信告知我们,我们将立即予以删除。

文章目录

第四章 串

串的定义与实现

概念

  • 串的概念

    • 零个或多个任意字符组成的有限序列(内容受限的线性表)
  • 子串的概念

    • 一个串中任意个连续字符组成的子序列(含空串)




小结

串的存储结构(和线性表几乎一样,仅将存储数据的类型改为字符)

顺序存储结构


char 8bit 0~255

链式存储结构


  • 一个结点若只存一个字符,存储密度过低,引出块链存储结构

小结
块链存储结构
  • 每个结点既可以存放一个字符,也可以存放多个字符。每个结点称为块

串的模式匹配

简单模式匹配算法

  • 概念

    • 子串的定位操作通常称为串的模式匹配,它求的是子串(模式串)在主串中的位置
  • 算法思想

    • 将主串中与模式串长度相同的子串逐个与模式串匹配,暴力法

  • 缺点

    • 主串指针回溯导致时间开销,时间复杂度为:O(nm),nm分别为主串和模式串的长度

KMP算法

  • 基本概念

    • 前缀

      • 除最后一个字符外,字符串的所有头部子串
    • 后缀

      • 除第一个字符外,字符串的所有尾部子串
  • 算法思想

    • 主串指针不必回溯,模式串指针根据next数组部分回溯(如果已匹配相等的前缀序列中有某个后缀正好是模式的前缀,可以将模式串向后滑动到与这些相等字符对齐的位置)
  • next数组

    • 表明当模式中第j个字符与主串中相应字符匹配失败时,在模式中需重新和主串中该字符进行比较的字符位置

      • 即衡量模式串向后滑动的量
    • 计算

        • 以"abab"为例

          • 序号j = 1时,属于j == 1情况,next[j] = 0

          • 序号j = 2时,'a'的前后缀都为空集,属于其他情况,next[j] = 1

          • 序号j = 3时,'ab'的前缀为{a},后缀为{b},交集为空,属于其他情况,next[j] = 1

          • 序号j = 4时,'aba'的前缀为{a,ab},后缀为{a,ba},交集为{a},k - 1 = 1(长度),next[j] = k = 2(长度+1)

  • 时间复杂度:O(m + n)

手算
  • 1

  • 2

  • 3

  • 4

  • 5

  • 6



进一步优化

  • 构造nextval数组
      • 若模式串指向的位置的字符等于本身,可以直接赋值

      • 举例

        • 5号的a中next数组指向3号位置,3号位置也是a故直接把3号的next数组值复制过去

        • 6号的a中next数组指向4号位置,两者字符不同,不能优化

代码



王道代码见教材

补充代码

cpp 复制代码
cin >> n >> p+1 >> m >> s+1;// char数组s是长文本,p是模式串,且从数组下标1开始存储
for(int i=2,j=0;i<=n;i++){  //求next数组
    while(j&&p[i]!=p[j+1]) j=ne[j];
    if(p[i]==p[j+1]) j++;
    ne[i]=j;
}
for(int i=1,j=0;i<=m;i++){  //匹配
    while(j&&s[i]!=p[j+1]) j=ne[j];
    if(s[i]==p[j+1]) j++;
    if(j==n){
        j=ne[j];
        //匹配成功
    }
}

考研真题

408 - 2023

(考研真题待更新)

相关推荐
越城27 分钟前
数据结构中的栈与队列:原理、实现与应用
c语言·数据结构·算法
似水এ᭄往昔29 分钟前
【数据结构】——栈和队列OJ
c语言·数据结构·c++
lwewan1 小时前
26考研——中央处理器_指令执行过程(5)
笔记·考研
双叶8361 小时前
(C语言)超市管理系统(测试版)(指针)(数据结构)(二进制文件读写)
c语言·开发语言·数据结构·c++
想睡hhh3 小时前
c++进阶——哈希表的实现
开发语言·数据结构·c++·散列表·哈希
打鱼又晒网4 小时前
数据类型:List
数据结构·list
java程序员CC5 小时前
记录为什么LIst数组“增删慢“,LinkedList链表“查改快“?
数据结构·链表·list
.格子衫.6 小时前
015枚举之滑动窗口——算法备赛
数据结构·算法
Hell with it13 小时前
【bibtex4word】在Word中高效转换bib参考文献,Texlive环境安装bibtex4word插件
考研·学习方法
jiunian_cn15 小时前
【c++】异常详解
java·开发语言·数据结构·c++·算法·visual studio