1. 题目链接:76. 最小覆盖子串
2. 题目描述:
给你一个字符串
s
、一个字符串t
。返回s
中涵盖t
所有字符的最小子串。如果s
中不存在涵盖t
所有字符的子串,则返回空字符串""
。注意:
- 对于
t
中重复字符,我们寻找的子字符串中该字符数量必须不少于t
中该字符数量。- 如果
s
中存在这样的子串,我们保证它是唯一的答案。示例 1:
输入:s = "ADOBECODEBANC", t = "ABC" 输出:"BANC" 解释:最小覆盖子串 "BANC" 包含来自字符串 t 的 'A'、'B' 和 'C'。
示例 2:
输入:s = "a", t = "a" 输出:"a" 解释:整个字符串 s 是最小覆盖子串。
示例 3:
输入: s = "a", t = "aa" 输出: "" 解释: t 中两个字符 'a' 均应包含在 s 的子串中, 因此没有符合条件的子字符串,返回空字符串。
提示:
m == s.length
n == t.length
1 <= m, n <= 105
s
和t
由英文字母组成
3. 解法(滑动窗口+哈希表)
3.1 算法思路:
- 创建两个哈希表,其中一个将目标串的信息统计起来,另一个哈希表动态的维护窗口内字符串的信息
- 当动态哈希表中包含目标串中所有的字符,并且对应的个数都不小于目标串的哈希表中各字符的个数,那么当前的窗口就是一种可行的方案
3.2 算法流程:
-
定义两个辅助数组:
hash1
和hash2
。hash1
用于统计字符串t
中每个字符的频次,hash2
用于统计窗口内每个字符的频次。 -
使用变量
kinds
统计字符串t
中有效字符的种类数。遍历字符串t
,若hash1[ch]++ == 0
,则表示该字符是新字符,将kinds
加1。 -
初始化变量
minlen
为最大整数,表示最小窗口的长度,begin
为-1,表示最小窗口的起始位置。 -
使用双指针
left
和right
,遍历字符串s
。对于每个字符in=s[right]
,将其在hash2
中的频次加1。 -
如果
hash2[in] == hash1[in]
,说明窗口内的某个字符in
已经达到了所需的频次,将count
加1。 -
如果
count
等于kinds
,说明窗口内包含了字符串t
中的所有有效字符。此时需要更新结果。 -
如果当前窗口的长度小于
minlen
,将minlen
更新为当前窗口的长度,begin
更新为当前窗口的起始位置。 -
将窗口左边界向右移动,即将字符
s[left++]
移出窗口。如果hash2[out] == hash1[out] - 1
,说明窗口内的字符out
频次减少后仍然满足要求,将count
减1。 -
重复步骤4至8,直到
right
遍历完整个字符串s
。 -
最后判断
begin
是否仍然为-1,如果是则表示未找到满足要求的最小窗口子串,返回空字符串。否则,返回字符串s
中起始位置为begin
,长度为minlen
的子串作为结果。
3.3 C++算法代码:
c++
class Solution {
public:
string minWindow(string s, string t) {
int hash1[128]={0};//统计字符串t中每个字符的频次
int kinds=0;//统计有效字符有多少种
for(auto ch:t)
if(hash1[ch]++==0) kinds++;
int hash2[128]={0};//统计窗口内每个字符的频次
int minlen=INT_MAX,begin=-1;
for(int left=0,right=0,count=0;right<s.size();right++)
{
char in=s[right];
if(++hash2[in]==hash1[in]) count++;//进窗口+维护count
while(count==kinds) //判断条件
{
if(right-left+1<minlen)//更新结果
{
minlen=right-left+1;
begin=left;
}
char out=s[left++];
if(hash2[out]--==hash1[out]) count--;
}
}
if(begin==-1) return "";
else return s.substr(begin,minlen);
}
};