字符串 (3)--- KMP 算法的扩展

对于个长度为n的字符串s。定义函数zi表示s和si,n-1(即以 si 开头的后缀)的最长公共前缀(LCP)的长度。

z被称为s的Z函数。特别地,z0 = 0。

如同大多数字符串主题所介绍的算法,其关键在于,运用自动机的思想寻找限制条件下的状态转移函数,

使得可以借助之前的状态来加速计算新的状态。

在该算法中,我们从1到n-1顺次计算zi的值(z0=0)。

在计算zi的过程中,我们会利用已经计算好的z0,...,zi-1

对于i,我们称区间i, i+z\[i-1]是i的匹配段,也可以叫Z-box。

算法的过程中我们维护右端点最靠右的匹配段。为了方便,记作 l, r

根据定义,sl, r 是s的前缀。在计算 zi 时我们保证l <= i。初始时l=r=0。

计算完前i-1个z函数,维护Z-box的l, r, 则sl, r = s0, r-l

在计算zi的过程中:

(1)如果 i <= r(在Z-box内),那么根据 l, r 的定义有 si, r = si-l, r-l 同时减l,

因此 zi >= min(zi-l, r-i+1)。

这时:

若 zi-l < r-i+1,则 zi = zi-l

否则 zi-l >= r-i+1,这时我们令 zi = r-i+1,

然后暴力枚举下一个字符扩展 zi 直到不能扩展为止。

(2)如果 i > r(在Z-box外),那么我们直接按照朴素算法,从si开始比较,暴力求出zi

在求出zi后,如果i+zi-1 > r,我们就需要更新l,r,即令 l=i, r=i+zi-1。

当i=4时,l=4,r=5, 我们发现s4\~5==s0\~1,z4==z0,z5==z1

即如果存在si\~r==si-l\~r-l, 可以直接更新zi=zi-l

否则,逐位比较去得出i位置的z函数值

#include <iostream>

#include <vector>

using namespace std;

vector<int> z_fun(string& s)

{

int n = (int) s.length();

vector<int> z(n);

for (int i = 1, l = 0, r = 0; i < n; ++i)

{

if (i <= r)

zi = min (r - i + 1, zi - l); // r-i+1: 右端点r到i的距离

// 逐位比较,字符串下标从0开始,双指针分别指向zi和i+zi

while (i + zi < n && sz\[i] == si + z\[i])

++zi;

if (i + zi - 1 > r)

{

l = i;

r = i + zi - 1;

}

}

return z;

}

int main()

{

string s = "aaabaab";

vector<int> vec = z_fun(s);

return 0;

}

相关推荐
To_OC17 小时前
LC 1 两数之和:面试第一道必考题,暴力解法直接被面试官 pass
javascript·算法·leetcode
鱼鱼不愚与1 天前
《原来如此 | 第01期:为什么导航软件能预测红绿灯倒计时?》
算法
复杂网络1 天前
论最小 Agent 计算机的形态
算法
kisshyshy2 天前
🍦 雪糕、食堂、火车厢:三幅漫画吃透栈、队列与链表
javascript·算法
猿人谷2 天前
不只是 CPU 阈值:STAR 如何用 GAT + Transformer 做容器级自动扩缩容?
人工智能·算法
复杂网络2 天前
Stable Diffusion 视觉大模型微调技术深度调研
算法
复杂网络2 天前
基于 Stable Diffusion 架构的视觉大模型代表性工作与原理深度解析
算法
MrZhao4002 天前
Agent Loop 如何用 Hook 扩展:权限、日志与工具拦截
算法
MrZhao4002 天前
Agent 为什么需要 Skills:别把所有知识都塞进 system prompt
算法