1. 前言
作者最近深陷迷茫与焦虑中,在思考怎样才算学会的问题。也许让自己感到痛苦,走出舒适区,可能不是一种最有效的学习方式,但是它一定会给自己带来改变,所以我不断地思考
2. 题目描述



3. 思路分析
首先,从正向分析,这道题目的主要要求就是要在字符串 s 中找到一个子串,然后要找的这个子子串由字符串数组 words 演变而来,演变的方法就是把字符串数组 words 中的子的字符串进行排列组合。
然后,从逆向分析,就是说我们要先把字符串数组 words 中的子字符串进行排列组合,得到一个新的子串集合,然后去找遍历 s 串中的每一个位置,看是否能匹配上我们新构建的子串集合里面的字符串。
不过,针对此题 words 数组的大小最大是 5000,那么对这 5000 个元素进行全排列的构建将极大的占据时间复杂度和空间复杂度。
从另一个角度思考,本质上是在一个长串中找一个子串。然后作者就想用滑动窗口来解决问题。
4. 算法原理
(注:可以先看看 5. C++代码实现)
滑动窗口一般只需要解决三个问题,一个是右窗口的右移时机,左窗口的缩小时机,还有更新最后结果的时机。
因为这道题中说了 words 中所有字符串长度相同,所以说每次右窗口更新的时候所走的长度是 words 中字符串的长度。
倘若从一开始窗口左右指针都从 0 开始的话,那么只能遍历 words 中字符串长度的整数倍位置。所以说为了尽 s 串中所有的子串,我们需要把起始的位置设置成 words 字符串的长度,这样我们就能够遍历所有的子串了,所以说嵌套了两层循环。
在这道题目当中右窗口的更新是随着内存循环默认进行的。然后当更新的时候就会把更新的串通过 substr剪切时当前子串words元素数量增加,即map m2的统计更新
当前滑动窗口中元素的长度大于 words 中串的排列组合的长度的时候,就已经不符合题意了。所以说这个时候左窗口需要收缩。
更新结果的时机和左窗口收缩的时机是重叠在一起的。
最开始的时候要把 words 中单个元素的长度计算出来,那么在滑动窗口的左窗口收缩的时候,本质上是左指针走一个计算出的 words 元素的长度的步长
5. C++代码实现
cpp
class Solution {
public:
vector<int> findSubstring(string s, vector<string>& words) {
//words中元素构成的子串,由于不计顺序,所以只需统计数量
std::map<std::string, int> m1;
for (auto e : words) {
m1[e]++;
}
int len = words[0].size();//words中元素的长度
int total_len = len * (words.size());//words中元素排列组合后的总长
vector<int> ans;//存储答案下标
//第一层循环,保证能够尽量遍历s
for (int begin = 0; begin < len && begin < s.size(); begin++) {
std::map<std::string, int> m2;//临时存储窗口中子串元素数量
//第二层循环,每次循环走 words中元素的长度 步数
for (int l = begin, r = begin + len; r <= s.size(); r += len) {
m2[s.substr(r - len, len)] += 1;
if (m1 == m2 && r - l >= total_len) {//窗口中元素数量恰好等于所需子串
ans.push_back(l);//更新答案
m2[s.substr(l, len)]--;//左窗口右移 删除元素
if (m2[s.substr(l, len)] == 0) {
m2.erase(s.substr(l, len));
}
l += len;
}
else if (r - l >= total_len) {
m2[s.substr(l, len)]--;
if (m2[s.substr(l, len)] == 0) {
m2.erase(s.substr(l, len));
}
l += len;
}
}
}
return ans;
}
};
6. 复杂度分析
外层循环的次数与 words 中元素的长度有关,内层循环的次数和 s 串的长度除以 words 串的长度有关。
若 s 长度为 n,words 中元素长度为 m
那么复杂度就是O(m * (n / m) )= O(n)