【算法一周目】滑动窗口(2)

目录

水果成篮

解题思路

代码实现

找到字符串中所有字母异位词

解题思路

代码实现

串联所有单词的子串

解题思路

代码实现

最小覆盖子串

解题思路

代码实现


水果成篮

题目链接904. 水果成篮

题目描述:

你正在探访一家农场,农场从左到右种植了一排果树。这些树用一个整数数组 fruits 表示,其中 fruits[i] 是第 i 棵树上的水果种类。你想要尽可能多地收集水果,但是有一些规则:

  • 你有两个篮子每个篮子只能装一种类型的水果,篮子的容量无限制。
  • 你可以选择任意一棵树开始采摘 ,但必须从这棵树开始依次向右采摘每棵树上的水果
  • 一旦遇到某棵树上的水果不符合篮子中的水果种类 ,你必须停止采摘

返回你能采摘的最多的水果数量。

解题思路

解法:滑动窗口+哈希

根据题目要求,所求问题其实就是找一段最多只含两个不同元素的最长子区间 ,我们使用滑动窗口+哈希解决。

有一点值得注意,fruits[i] 是第 i 棵树上的水果种类,不是种类数。

具体过程如下:

  • 1.初始化哈希表 hash左右指针 left 和 right记录结果的变量 ret
  • 2.right 向右遍历数组将 right 位置的水果加入哈希表,统计频次。
  • 如果哈希表的大小超过2让left++并同时更新哈希表直至哈希表的大小不超过2
  • 3.更新结果 ret。
  • 4重复上述过程,直到 right 遍历完数组。

代码实现

1.使用unordered_map作为hash表

cpp 复制代码
class Solution {
public:
    int totalFruit(vector<int>& fruits) {
        // 统计滑动窗口内水果的种类和数量
        unordered_map<int, int> hash;
        int n = fruits.size(), ret = 0;
        for(int left = 0, right = 0; right < n; right++)
        {
            //进窗口,将水果加入hash表
            hash[fruits[right]]++;

            //若水果种类超过2,收缩窗口直到种类不超过2
            while(hash.size() > 2)
            {
                hash[fruits[left]]--;
                if(hash[fruits[left]] == 0) hash.erase(fruits[left]);
                left++;
            }
            //更新结果
            ret = max(ret, right - left + 1);
        }
        return ret;
    }
};

2.使用数组模拟hash表

题目其实有提到 fruits[i] 的范围 ,所以我们不必真的使用unordered_map作为hash表使用数组模拟 即可,这样虽然会浪费空间但是提高了效率

cpp 复制代码
class Solution {
public:
    int totalFruit(vector<int>& fruits) {
        int hash[100000] = { 0 };
        //cnt用于统计hash表的水果的种类个数
        int n = fruits.size(), ret = 0, cnt = 0;
        for(int left = 0, right = 0; right < n; right++)
        {
            hash[fruits[right]]++;
            if(hash[fruits[right]] == 1) cnt++;
            while(cnt > 2)
            {
                hash[fruits[left]]--;
                if(hash[fruits[left++]] == 0) cnt--;
            }
            ret = max(ret, right - left + 1);
        }
        return ret;
    }
};

时间复杂度:O(n)

空间复杂度:O(n)


找到字符串中所有字母异位词

题目链接438. 找到字符串中所有字母异位词

题目描述

给定两个字符串 s 和 p,找到 s 中所有 p 的 异位词子串 ,返回这些子串的起始索引。顺序可以不考虑。

异位词是指由相同字母重排列形成的字符串(包括相同的字符串)。

解题思路

解法:滑动窗口 + 哈希

因为字符串 p 的异位词的长度一定于字符串 p 的长度相等 ,所以我们可以在字符串 s 中使用与字符串 p 等长度的滑动窗口来求解。

我们可以使用两个大小为26的数组来模拟哈希表 ,用于统计窗口内的字母频次字符串s的字母频次当比较得到两个哈希表相等时 ,说明滑动窗口中每种字母的数量字符 p 每种字母的数量相同,窗口内的字符是字符 p 的一个异位词,此时记录窗口起始索引。

具体过程如下:

  • 1.初始化 left 和 right 指针来维护滑动窗口两个大小为26的数组 hash1 和 hash2 来模拟哈希表,记录字符串 p 的字母频次和窗口字母频次。

  • 2.right 向右遍历数组

  • right 位置的字母入窗口 ,将其加入哈希表

  • 滑动窗口长度大于字符串 p 的长度 时,left++将窗口左侧字母移除 同时更新其在哈希表的频次。

  • 3.更新结果,当 hash1 与 hash2 相等时记录窗口起始索引

注意:判断两个 hash 表是否相等的时间复杂度较高效率较低 。故我们要优化更新结果的判断条件(两个哈希表相等) ,我们可以来使用一个变量 cnt 记录窗口内的字母相较于字符串 p 的有效字符的数量 ,并在入窗口和窗口时维护 cnt ,这样更新结果时 ,只需判断 cnt 是否等于字符串 p 的长度 就可以知道窗口字符是否是字符串 p 的异位词

解释下有效字符的数量,其实就是让窗口的组成字母尽可能接近字符 p当有效字符的数量等于字符 p 的长度 ,就说明了窗口的字母频次与字符 p 的字母频次相等 ,这也是比较两个统计字母频次的哈希表相等的本质cnt 间接完成了这个任务

代码实现

cpp 复制代码
class Solution {
public:
    vector<int> findAnagrams(string s, string p) {
        vector<int> ret;
        int n = s.size(), m = p.size();
        //统计p字符串中每个字母出现的个数
        int hash1[26] = { 0 };
        for(auto ch : p) hash1[ch - 'a']++;
        
        //统计窗口中每个字母出现的个数
        int hash2[26] = { 0 };
        //统计窗口中有效字符的数量
        int cnt = 0;
        for(int left = 0, right = 0; right < n; right++)
        {
            //进窗口 + 维护cnt
            char in = s[right];
            hash2[in - 'a']++;
            if(hash2[in - 'a'] <= hash1[in - 'a']) cnt++;

            //窗口长度大于字符串p的长度,窗口左端字母出窗口,
            //并更新cnt和哈希表
            if(right - left + 1 > m)
            {
                char out = s[left++];
                //出窗口 + 维护cnt
                if(hash2[out - 'a'] <= hash1[out - 'a']) cnt--;
                hash2[out - 'a']--;
            }

            //更新结果
            if(cnt == m) ret.push_back(left);

        }
        return ret;
    }
};

时间复杂度:O(n)

空间复杂度:O(1)


串联所有单词的子串

题目链接30. 串联所有单词的子串

题目描述:

给定一个字符串 s 和一个字符串数组 words,words 中所有字符串的长度相同s 中的 串联子串 是指包含 words 中所有字符串以任意顺序排列连接起来的子串。

例如,如果 words = ["ab","cd","ef"],那么 "abcdef", "abefcd", "cdabef", "cdefab", "efabcd" 和 "efcdab" 都是串联子串,而 "acdbef" 不是串联子串,因为它不是 words 排列的连接。

返回所有串联子串在 s 中的开始索引,顺序可以不考虑。

解题思路

解法:滑动窗口 + 哈希表

这道题就是找到字符串中所有字母异位词的升级版 ,从原来处理单个字符变成了处理单个单词 ,我们只需要将 words 的单词看成单个字母 就行了,然后用滑动窗口 + 哈希表解决。

具体过程:

1.用哈希表 hash1 记录 words 中每个单词的频次

2.遍历字符串 s ,并用哈希表 hash2 来维护滑动窗口内的单词频次 ,注意每次增加窗口的大小为单词的长度。

3**.当窗口大小大于所有单词的总长度时** ,出窗口和更新 hash2

4**.当 hash1 和 hash2 两个哈希表相等时**,更新结果。

判断两个哈希表是否相等消耗较大,用 count 来优化 ,**count 统计滑动窗口内有效单词的个数。**当 count 与 words 的单词个数相等时,说明找到了符合条件的一个窗口。

代码实现

cpp 复制代码
class Solution {
public:
    vector<int> findSubstring(string s, vector<string>& words) {
        vector<int> ret;
        unordered_map<string, int> hash1;
        for(auto& e : words) hash1[e]++;

        int len = words[0].size(), m = words.size(), n = s.size();
        //执行len次滑动窗口
        for(int i = 0; i < len; ++i)
        {
            unordered_map<string, int> hash2;
            for(int left = i, right = i, count = 0; right <= n - len; right += len)
            {
                //进窗口+维护count
                string in(s.begin() + right, s.begin() + right + len);
                hash2[in]++;
                if(hash1.count(in) && hash2[in] <= hash1[in]) count++;
                
                //判断+出窗口+维护count
                if(right - left + 1 > m * len)
                {
                    string out(s.begin() + left, s.begin() + left + len);
                    if(hash1.count(out) && hash2[out] <= hash1[out]) count--;
                    hash2[out]--;
                    left += len;
                }

                //更新结果
                if(count == m)
                    ret.push_back(left);
            }
        }

        return ret;
    }
};

1.执行 len 次滑动窗口(len 是单词长度):由 s 字符串的长度不一定是单词长度的整数倍,需要执行 len 滑动窗口来保证答案的完整性。

2.注意 right 的范围,right 最后一次执行循环的位置应该是在 n - len 处。

时间复杂度O( n * len) ,其中 n 是字符串 s 的长度,需要 len 次滑动窗口,每次遍历一次 s。

空间复杂度O(m * len) ,m 是单词个数,每次滑动窗口都需要用一个哈希表来存储单词频次。


最小覆盖子串

题目链接76. 最小覆盖子串

题目描述

给你一个字符串 s 和一个字符串 t 。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在这样的子串,则返回空字符串 ""

注意:

  • 对于 t 中重复的字符,最小子串中该字符数量必须不少于 t 中的字符数量。
  • 如果存在这样的子串,答案是唯一的。

解题思路

解法:滑动窗口+哈希

根据题目,我们直接根据暴力解法来优化,就得到滑动窗口+哈希的解题方法。

具体过程如下:

1. 利哈希表 hash1 来统计字符串 t 中每个字符出现的频次。

2. 使用滑动窗口遍历字符串 s ,并用哈希表 hash2 来统计窗口中字符频次。

**3.**当窗口的字符频次满足要求时,更新结果,然后收缩窗口,直到窗口字符频次不满足要求。

注意:这里判断窗口的字符频次满足要求不是判断两个哈希表是否相等 ,而是 hash1 的字符频次要完整的出现在 hash2 中,hash1 中可以出现除字符串 t 中的字符以外的字符频次。也就是说,窗口内只要完整出现字符串 t 的所有字符即可(字符种类及其对应的频次)。

我们这里还是利用 count 来完成判断 ,这里的 count 统计的时有效字符的种类只有 t 中的单个字符在窗口内出现的频次与在 t 中完全一样,count 才自增1,同理,频次不相等时就自减 1 ,当 count 与 t 中字符种类数相同 时,说明找到一个符合条件的覆盖字串更新结果。

代码实现

cpp 复制代码
class Solution {
public:
    string minWindow(string s, string t) {
        string ret;

        //hash1统计t字符频次和计算hash1的大小,hash1size统计t的字符种类
        int hash1[128] = { 0 }, hash1size = 0;
        for(auto e : t) 
            if(hash1[e]++ == 0) hash1size++;

        //hash2统计窗口字符频次
        int hash2[128] = { 0 };
        int len = INT_MAX, start = 0;
        //count统计有效字符的种类
        for(int left = 0, right = 0, count = 0; right < s.size(); right++)
        {
            //进窗口 + 维护count
            char in = s[right];
            if(++hash2[in] == hash1[in]) count++;
            //判断
            while(count == hash1size)
            {
                //更新结果
                if(right - left + 1 < len)
                {
                    len = right - left + 1;
                    start = left;
                }
                
                //出窗口+维护count
                char out = s[left++];
                if(hash2[out]-- == hash1[out]) count--;
            }
        }
        ret = len == INT_MAX ? "" : s.substr(start, len);
        return ret;
    }
};

时间复杂度:O(n)

空间复杂度:O(1)


拜拜,下期再见😏

摸鱼ing😴✨🎞

相关推荐
小孟Java攻城狮3 小时前
leetcode-不同路径问题
算法·leetcode·职场和发展
查理零世4 小时前
算法竞赛之差分进阶——等差数列差分 python
python·算法·差分
小猿_006 小时前
C语言程序设计十大排序—插入排序
c语言·算法·排序算法
肖田变强不变秃6 小时前
C++实现矩阵Matrix类 实现基本运算
开发语言·c++·matlab·矩阵·有限元·ansys
熊文豪8 小时前
深入解析人工智能中的协同过滤算法及其在推荐系统中的应用与优化
人工智能·算法
雪靡11 小时前
正确获得Windows版本的姿势
c++·windows
siy233311 小时前
[c语言日寄]结构体的使用及其拓展
c语言·开发语言·笔记·学习·算法
可涵不会debug11 小时前
【C++】在线五子棋对战项目网页版
linux·服务器·网络·c++·git
AI+程序员在路上11 小时前
C#调用c++dll的两种方法(静态方法和动态方法)
c++·microsoft·c#
吴秋霖11 小时前
最新百应abogus纯算还原流程分析
算法·abogus