字符串 (3)--- KMP 算法的扩展

对于个长度为n的字符串s。定义函数zi表示s和si,n-1(即以 si 开头的后缀)的最长公共前缀(LCP)的长度。

z被称为s的Z函数。特别地,z0 = 0。

如同大多数字符串主题所介绍的算法,其关键在于,运用自动机的思想寻找限制条件下的状态转移函数,

使得可以借助之前的状态来加速计算新的状态。

在该算法中,我们从1到n-1顺次计算zi的值(z0=0)。

在计算zi的过程中,我们会利用已经计算好的z0,...,zi-1

对于i,我们称区间i, i+z\[i-1]是i的匹配段,也可以叫Z-box。

算法的过程中我们维护右端点最靠右的匹配段。为了方便,记作 l, r

根据定义,sl, r 是s的前缀。在计算 zi 时我们保证l <= i。初始时l=r=0。

计算完前i-1个z函数,维护Z-box的l, r, 则sl, r = s0, r-l

在计算zi的过程中:

(1)如果 i <= r(在Z-box内),那么根据 l, r 的定义有 si, r = si-l, r-l 同时减l,

因此 zi >= min(zi-l, r-i+1)。

这时:

若 zi-l < r-i+1,则 zi = zi-l

否则 zi-l >= r-i+1,这时我们令 zi = r-i+1,

然后暴力枚举下一个字符扩展 zi 直到不能扩展为止。

(2)如果 i > r(在Z-box外),那么我们直接按照朴素算法,从si开始比较,暴力求出zi

在求出zi后,如果i+zi-1 > r,我们就需要更新l,r,即令 l=i, r=i+zi-1。

当i=4时,l=4,r=5, 我们发现s4\~5==s0\~1,z4==z0,z5==z1

即如果存在si\~r==si-l\~r-l, 可以直接更新zi=zi-l

否则,逐位比较去得出i位置的z函数值

#include <iostream>

#include <vector>

using namespace std;

vector<int> z_fun(string& s)

{

int n = (int) s.length();

vector<int> z(n);

for (int i = 1, l = 0, r = 0; i < n; ++i)

{

if (i <= r)

zi = min (r - i + 1, zi - l); // r-i+1: 右端点r到i的距离

// 逐位比较,字符串下标从0开始,双指针分别指向zi和i+zi

while (i + zi < n && sz\[i] == si + z\[i])

++zi;

if (i + zi - 1 > r)

{

l = i;

r = i + zi - 1;

}

}

return z;

}

int main()

{

string s = "aaabaab";

vector<int> vec = z_fun(s);

return 0;

}

相关推荐
BAGAE11 分钟前
星链卫星数据获取:从太空安全到实时通信的技术革命
网络·数据结构·数据库·算法·云计算·hbase
happymaker062614 分钟前
LeetCodeHor100——438.找到字符串中所有的字母异位词
算法
西安邮电大学20 分钟前
有关栈的经典算法题
java·后端·其他·算法·面试
h_a_o777oah32 分钟前
【算法专项】扩展域并查集:原理详解及解决大部分种类并查集问题(洛谷P5937 P2024 C++代码)
数据结构·c++·算法·acm·并查集·扩展域·逻辑建模
兰令水1 小时前
leecodecode【单调栈】【2026.6.12打卡-java版本】
java·开发语言·算法
TMT星球1 小时前
魔法原子上交会首秀VLA K02大模型,完成具身智能从“执行”到“理解”的能力跃迁
人工智能·算法·机器学习
2301_764441331 小时前
番茄钟+AI:高效专注的秘密武器
人工智能·算法·数学建模·动态规划·交互
影寂ldy1 小时前
C# 泛型委托
java·算法·c#
星马梦缘1 小时前
算法设计与分析 作业三 纯答案
算法
不知名的老吴2 小时前
经典算法题之行星碰撞
数据结构·算法