本文属于「征服LeetCode」系列文章之一,这一系列正式开始于2021/08/12。由于LeetCode上部分题目有锁,本系列将至少持续到刷完所有无锁题之日为止;由于LeetCode还在不断地创建新题,本系列的终止日期可能是永远。在这一系列刷题文章中,我不仅会讲解多种解题思路及其优化,还会用多种编程语言实现题解,涉及到通用解法时更将归纳总结出相应的算法模板。
为了方便在PC上运行调试、分享代码文件,我还建立了相关的仓库:https://github.com/memcpy0/LeetCode-Conquest。在这一仓库中,你不仅可以看到LeetCode原题链接、题解代码、题解文章链接、同类题目归纳、通用解法总结等,还可以看到原题出现频率和相关企业等重要信息。如果有其他优选题解,还可以一同分享给他人。
由于本系列文章的内容随时可能发生更新变动,欢迎关注和收藏征服LeetCode系列文章目录一文以作备忘。
给你一个下标从 0 开始的字符串 s
和一个单词字典 dictionary
。你需要将 s
分割成若干个 互不重叠 的子字符串,每个子字符串都在 dictionary
中出现过。s
中可能会有一些 额外的字符 不在任何子字符串中。
请你采取最优策略分割 s
,使剩下的字符 最少 。
示例 1:
java
输入:s = "leetscode", dictionary = ["leet","code","leetcode"]
输出:1
解释:将 s 分成两个子字符串:下标从 0 到 3 的 "leet" 和下标从 5 到 8 的 "code" 。只有 1 个字符没有使用(下标为 4),所以我们返回 1 。
示例 2:
java
输入:s = "sayhelloworld", dictionary = ["hello","world"]
输出:3
解释:将 s 分成两个子字符串:下标从 3 到 7 的 "hello" 和下标从 8 到 12 的 "world" 。下标为 0 ,1 和 2 的字符没有使用,所以我们返回 3 。
提示:
1 <= s.length <= 50
1 <= dictionary.length <= 50
1 <= dictionary[i].length <= 50
dictionary[i]
和s
只包含小写英文字母。dictionary
中的单词互不相同。
我们有一个字符串 s s s 和一个 d i c t i o n a r y dictionary dictionary 。目标是将 s s s 分解为一个或多个不重叠的子字符串,每个子字符串都出现在 d i c t i o n a r y dictionary dictionary 中,并最大限度地减少剩余的额外字符数。
我们可以使用动态规划来解决这个问题。有两种常见的方法:自下而上(迭代)和自上而下(带记忆的递归)。这两种方法都旨在找到最少额外字符数(从字符串末尾遍历到开头)。
初始化:初始化一个 d p dp dp 数组,在字符串 s s s 的每个位置存储最少额外字符数。先要将 d p dp dp 中所有元素初始化为一个最大值(例如, − 1 -1 −1 或一个大数字),表示它们还没有被计算出来。
解法1 记忆化搜索------自上而下方法
设 n n n 为 s s s 的长度,我们可以定义一个递归函数 d f s ( i ) dfs(i) dfs(i) ,该函数从字符串 s [ i ] s[i] s[i] 开始计算最少额外字符数。并使用数组 d p dp dp 来存储中间结果,以避免重复计算;将 d p dp dp 中的所有元素初始化为一个特殊值(例如 − 1 -1 −1 ),表示它们还没有计算出来。
在递归函数中,如果 d p [ i ] dp[i] dp[i] 已经算出则直接返回 ;如果尚未计算 (等于 − 1 -1 −1 ),则按如下方式计算:
- 初始化 d p [ i ] dp[i] dp[i] ,值为 1 + d f s ( s , i + 1 ) 1+dfs(s, i+1) 1+dfs(s,i+1) ,表示在当前字符处断开字符串,并将当前字符 s [ i ] s[i] s[i] 作为额外字符,在下一位置找到的最少额外字符数中添加这个额外字符。即直接跳过当前字符 s [ i ] s[i] s[i] ,让问题变为 s s s 的后面 n − i − 1 n - i - 1 n−i−1 个字符的子问题。
- 检查 d i c t i o i n a r y dictioinary dictioinary 中的每个单词,是否与「从当前位置 i i i 开始的子串」匹配。如果找到匹配,则将 d p [ i ] dp[i] dp[i] 更新为其当前值和 1 + d f s ( s , i + w . s i z e ( ) ) 1+dfs(s, i+w.size()) 1+dfs(s,i+w.size()) 之间的最小值,其中 w . s i z e ( ) w.size() w.size() 是匹配单词的长度。
最后返回 d p [ 0 ] dp[0] dp[0] ,它表示从位置 0 0 0 开始的最小额外字符数。
cpp
class Solution {
public:
int n;
vector<int> dp;
int dfs(string &s, vector<string>& d, int i) {
if (i >= n) return 0;
if (dp[i] != -1) return dp[i]; // 已经计算了
dp[i] = 1 + dfs(s, d, i + 1);
for (string& w : d)
if (i + w.size() <= n && s.compare(i, w.size(), w) == 0)
dp[i] = min(dp[i], dfs(s, d, i + w.size()));
return dp[i];
}
int minExtraChar(string s, vector<string>& dictionary) {
n = s.size();
dp.resize(n, -1);
return dfs(s, dictionary, 0);
}
};
解法2 动态规划------自下而上(迭代)
开始从末尾(从右到左)遍历字符串 s s s 。
- 对于每个位置 i i i ,使用值 1 + d p [ i + 1 ] 1+dp[i+1] 1+dp[i+1] 初始化 d p [ i ] dp[i] dp[i] 。这表示在当前字符处断开字符串,并将当前字符 s [ i ] s[i] s[i] 作为额外字符,在下一位置找到的最少额外字符数中添加这个额外字符 adding one extra character to the minimum extra characters found in the next position 。
- 然后检查 d i c t i o n a r y dictionary dictionary 中的每个单词,是否与「从当前位置 i i i 开始的子串」匹配,即不把 s [ i ] s[i] s[i] 作为额外字符去除。如果找到匹配,将 d p [ i ] dp[i] dp[i] 更新为其当前值与 d p [ i + w . s i z e ( ) ] dp[i+w.size()] dp[i+w.size()] 两者间最小值,其中 w . s i z e ( ) w.size() w.size() 是匹配单词的长度。
- 对字符串 s s s 中的所有位置继续此过程,d p [ 0 ] dp[0] dp[0] 的最终值将表示剩余的最小额外字符数。
cpp
class Solution {
public:
int minExtraChar(string s, vector<string>& dictionary) {
int n = s.size();
vector<int> dp(n + 1);
// dp[i]表示从s[i:n)中分割剩下的最少字符数
for (int i = n - 1; i >= 0; --i) {
dp[i] = dp[i + 1] + 1;
for (string& w : dictionary)
if (i + w.size() <= n && s.compare(i, w.size(), w) == 0)
dp[i] = min(dp[i], dp[i + w.size()]);
}
return dp[0];
}
};
复杂度分析:
- 时间复杂度: O ( n m L ) O(nmL) O(nmL) ,其中 n n n 为 s s s 的长度, m m m 为 d i c t i o n a r y dictionary dictionary 的长度, L L L 为 dictionary \textit{dictionary} dictionary 所有字符串的长度之和。动态规划的时间复杂度 = 状态个数 × \times × 单个状态的计算时间。本题中状态个数等于 O ( n ) O(n) O(n) ,单个状态的计算时间为 O ( m L ) O(mL) O(mL) 。
- 空间复杂度: O ( n ) O(n) O(n) 。