leetcode459 重复的子字符串 周期性字符串问题 KMP算法

1.移动匹配法:

如果一个字符串s是周期串,则s+s的中间一定有一部分s

我们在判断 s + s 拼接的字符串里是否出现一个s的的时候,要刨除 s + s 的首字符和尾字符,这样避免在s+s中搜索出原来的s,我们要搜索的是中间拼接出来的s。

begin()返回向量头指针,指向第一个元素

end()返回向量尾指针,指向向量最后一个元素的下一个位置

t.find(s)std::string 的成员函数,用于在字符串 t 中查找子串 s

std::string::npos 是一个常量,表示"未找到"或"无效位置"

cpp 复制代码
class Solution {
public:
    bool repeatedSubstringPattern(string s) {
        string t = s + s;
        t.erase(t.begin());
        t.erase(t.end()-1);
        if(t.find(s) != string::npos) return true;
        return false;
    }
};

2.KMP法:最小重复单位就是最长相等前后缀不包含的那个部分

公式:len(s) % (len(s) - maxLen) = 0

其中 len(s) 为字符串 s 的长度maxLen 为最长公共前后缀的长度

如果 s 是周期串,那【s 的长度】是【s 的长度减去最长公共前后缀的长度】的倍数,那字符串 s 就是周期串

如果是周期串,那对应位置上的字母应该是一样的,如果对应位置上的字母不一样,那就肯定不是周期串。maxLen == 0 or s[n - 1] != s[n - 1 - maxLen]

next数组存放的元素是某个阶段上重复的元素个数,由于能组成重复元素的长串next数组一定是整体向上递增的(即使中间数字会有波动起伏),取next最后一个元素就是最长相同前后缀(即重复的元素个数,记为max),len - max就是最小重复子串长度,如果len能被最小重复字串长度整除,说明长串均可由其构成。

cpp 复制代码
class Solution {
public:
    void getNext(int* next, string s){
        int i = 1;
        int j = 0;
        for(;i<s.size();i++){
            while(j > 0 && s[j] != s[i]){
                j = next[j-1];
            }
            if(s[j]==s[i]){
                j++;
            }
            next[i] = j;
        }
    }

    bool repeatedSubstringPattern(string s) {
        if(s.size() == 0) return false;
        vector<int> next(s.size());
        getNext(&next[0], s);
        int len = s.size();
        if(next[len - 1] != 0 && len % (len - (next[len - 1])) == 0) {
            return true;
        }   
        return false;
    }
};

int next[s.size()];

这种定义方式在 C++ 中是 变长数组(VLA) ,虽然在某些编译器中支持,但并不是 C++ 标准的一部分。如果 s.size() 为 0,或者 next 数组的大小不足以容纳 s.size() 个元素,就会导致未定义行为。

需要修改。

if(next[len - 1] != 0 && len % (len - (next[len - 1])) == 0) {

return true;

}

return false;

你提到的例子 s = "abcabcd" 非常好!它确实是一个特殊情况,可以帮助我们更深入地理解 next 数组和最长公共前后缀的关系。


1. 分析 s = "abcabcd"

  • 字符串 s = "abcabcd",长度为 7。

  • 我们手动计算它的 next 数组:

索引 (i) 前缀 s[0..i] 最长公共前后缀长度 (next[i])
0 "a" 0
1 "ab" 0
2 "abc" 0
3 "abca" 1
4 "abcab" 2
5 "abcabc" 3
6 "abcabcd" 0
  • next 数组为 [0, 0, 0, 1, 2, 3, 0]

  • next[len - 1] = next[6] = 0


2. 最长公共前后缀长度

  • 对于 s = "abcabcd"next[len - 1] = 0,表示整个字符串没有非平凡的最长公共前后缀。

  • 也就是说,字符串 s 的最长公共前后缀长度为 0。


3. 为什么 next[len - 1] 是最长公共前后缀长度?

  • next[len - 1] 表示前缀 s[0..len-1](即整个字符串 s)的最长公共前后缀的长度。

  • 如果 next[len - 1] = 0,说明整个字符串没有非平凡的最长公共前后缀。


4. 特殊情况分析

对于 s = "abcabcd"

  • next[len - 1] = 0,表示整个字符串没有非平凡的最长公共前后缀。

  • 因此,字符串 s 不能由某个子串重复多次构成。

所以判定条件前面也加了next[len-1] != 0

相关推荐
进击的_鹏13 分钟前
【C++】stack和queue以及priority_queue的使用以及模拟实现
开发语言·c++·算法
手握风云-14 分钟前
优选算法的智慧之光:滑动窗口专题(二)
数据结构·算法
闻缺陷则喜何志丹16 分钟前
【二分查找 前缀和】P10429 [蓝桥杯 2024 省 B] 拔河|普及+
c++·算法·前缀和·蓝桥杯·二分查找·洛谷·拔河
Jason_Orton32 分钟前
决策树(Decision Tree):机器学习中的经典算法
人工智能·算法·决策树·随机森林·机器学习
筏.k1 小时前
动态规划之 “完全背包“ ------P8646 [蓝桥杯 2017 省 AB] 包子凑数
算法·蓝桥杯·动态规划
clownAdam1 小时前
通俗易懂的分类算法之支持向量机详解
算法·支持向量机·分类·数据挖掘
飞3001 小时前
淘天集团算法岗-计算机视觉(T-Star Lab)内推
人工智能·算法·计算机视觉·业界资讯
apcipot_rain2 小时前
【密码学——基础理论与应用】李子臣编著 第二章 古典密码 课后习题
算法·网络安全·密码学
_Itachi__2 小时前
LeetCode 热题100 21. 合并两个有序链表
算法·leetcode·链表
萌の鱼3 小时前
leetcode 240. 搜索二维矩阵 II
数据结构·c++·算法·leetcode·矩阵