算法训练营Day44 - 动态规划part12

115.不同的子序列

给定一个字符串 s 和一个字符串 t ，计算在 s 的子序列中 t 出现的个数。

字符串的一个子序列是指，通过删除一些（也可以不删除）字符且不干扰剩余字符相对位置所组成的新字符串。（例如，"ACE" 是 "ABCDE" 的一个子序列，而 "AEC" 不是）

题目数据保证答案符合 32 位带符号整数范围。

提示：

0 <= s.length, t.length <= 1000
s 和 t 由英文字母组成

第一步确定dp数组以及下标的含义：

dp $i$ $j$ ：以i-1为结尾的s子序列中出现以j-1为结尾的t的个数为dp $i$ $j$ 。

第二步确定递推公式：

当s $i - 1$ 与 t $j - 1$ 相等时，dp $i$ $j$ 可以有两部分组成。

一部分是用s $i - 1$ 来匹配，那么个数为dp $i - 1$ $j - 1$ 。即不需要考虑当前s子串和t子串的最后一位字母，所以只需要 dp $i-1$ $j-1$ 。

一部分是不用s $i - 1$ 来匹配，个数为dp $i - 1$ $j$ 。

所以当s $i - 1$ 与 t $j - 1$ 相等时，dp $i$ $j$ = dp $i - 1$ $j - 1$ + dp $i - 1$ $j$ ;

当s $i - 1$ 与 t $j - 1$ 不相等时，dp $i$ $j$ 只有一部分组成，不用s $i - 1$ 来匹配（就是模拟在s中删除这个元素），即：dp $i - 1$ $j$

所以递推公式为：dp $i$ $j$ = dp $i - 1$ $j$ ;

第三步 dp数组如何初始化：

从递推公式dp $i$ $j$ = dp $i - 1$ $j - 1$ + dp $i - 1$ $j$ ; 和 dp $i$ $j$ = dp $i - 1$ $j$ ; 中可以看出dp $i$ $j$ 是从上方和左上方推导而来，如图：，那么 dp $i$ $0$ 和dp $0$ $j$ 是一定要初始化的。

dp $i$ $0$ 表示什么呢？

dp $i$ $0$ 表示：以i-1为结尾的s可以随便删除元素，出现空字符串的个数。

那么dp $i$ $0$ 一定都是1，因为也就是把以i-1为结尾的s，删除所有元素，出现空字符串的个数就是1。

再来看dp $0$ $j$ ，dp $0$ $j$ ：空字符串s可以随便删除元素，出现以j-1为结尾的字符串t的个数。

那么dp $0$ $j$ 一定都是0，s如论如何也变成不了t。

最后就要看一个特殊位置了，即：dp $0$ $0$ 应该是多少。

dp $0$ $0$ 应该是1，空字符串s，可以删除0个元素，变成空字符串t。

第四步确定遍历顺序：

从递推公式dp $i$ $j$ = dp $i - 1$ $j - 1$ + dp $i - 1$ $j$ ; 和 dp $i$ $j$ = dp $i - 1$ $j$ ; 中可以看出dp $i$ $j$ 都是根据左上方和正上方推出来的。

python 复制代码

class Solution:
    def numDistinct(self, s: str, t: str) -> int:
        dp = [[0] * (len(t)+1) for _ in range(len(s)+1)]
        for i in range(len(s)):
            dp[i][0] = 1
        for j in range(1, len(t)):
            dp[0][j] = 0
        for i in range(1, len(s)+1):
            for j in range(1, len(t)+1):
                if s[i-1] == t[j-1]:
                    dp[i][j] = dp[i-1][j-1] + dp[i-1][j]
                else:
                    dp[i][j] = dp[i-1][j]
        return dp[-1][-1]

583. 两个字符串的删除操作

给定两个单词 word1 和 word2，找到使得 word1 和 word2 相同所需的最小步数，每步可以删除任意一个字符串中的一个字符。

示例：

输入: "sea", "eat"
输出: 2
解释: 第一步将"sea"变为"ea"，第二步将"eat"变为"ea"

第一步确定dp数组以及下标的含义：

dp $i$ $j$ ：以i-1为结尾的字符串word1，和以j-1位结尾的字符串word2，想要达到相等，所需要删除元素的最少次数。

第二步确定递推公式：

当word1 $i - 1$ 与 word2 $j - 1$ 相同的时候，dp $i$ $j$ = dp $i - 1$ $j - 1$ ;

当word1 $i - 1$ 与 word2 $j - 1$ 不相同的时候，有三种情况：

情况一：删word1 $i - 1$ ，最少操作次数为dp $i - 1$ $j$ + 1

情况二：删word2 $j - 1$ ，最少操作次数为dp $i$ $j - 1$ + 1

情况三：同时删word1 $i - 1$ 和word2 $j - 1$ ，操作的最少次数为dp $i - 1$ $j - 1$ + 2

那最后当然是取最小值，所以当word1 $i - 1$ 与 word2 $j - 1$ 不相同的时候，递推公式：dp $i$ $j$ = min({dp $i - 1$ $j - 1$ + 2, dp $i - 1$ $j$ + 1, dp $i$ $j - 1$ + 1});

因为 dp $i$ $j - 1$ + 1 = dp $i - 1$ $j - 1$ + 2，所以递推公式可简化为：dp $i$ $j$ = min(dp $i - 1$ $j$ + 1, dp $i$ $j - 1$ + 1);

第三步 dp数组如何初始化：

从递推公式中，可以看出来，dp $i$ $0$ 和 dp $0$ $j$ 是一定要初始化的。

dp $i$ $0$ ：word2为空字符串，以i-1为结尾的字符串word1要删除多少个元素，才能和word2相同呢，很明显dp $i$ $0$ = i。

dp $0$ $j$ 的话同理

第四步确定遍历顺序：

从递推公式 dp $i$ $j$ = min(dp $i - 1$ $j - 1$ + 2, min(dp $i - 1$ $j$ , dp $i$ $j - 1$ ) + 1); 和dp $i$ $j$ = dp $i - 1$ $j - 1$ 可以看出dp $i$ $j$ 都是根据左上方、正上方、正左方推出来的。

所以遍历的时候一定是从上到下，从左到右，这样保证dp $i$ $j$ 可以根据之前计算出来的数值进行计算。

python 复制代码

class Solution:
    def minDistance(self, word1: str, word2: str) -> int:
        dp = [[0] * (len(word2)+1) for _ in range(len(word1)+1)]
        for i in range(len(word1)+1):
            dp[i][0] = i
        for j in range(len(word2)+1):
            dp[0][j] = j
        for i in range(1, len(word1)+1):
            for j in range(1, len(word2)+1):
                if word1[i-1] == word2[j-1]:
                    dp[i][j] = dp[i-1][j-1]
                else:
                    dp[i][j] = min(dp[i-1][j-1] + 2, dp[i-1][j] + 1, dp[i][j-1] + 1)
        return dp[-1][-1]

72. 编辑距离

给你两个单词 word1 和 word2，请你计算出将 word1 转换成 word2 所使用的最少操作数。

你可以对一个单词进行如下三种操作：

插入一个字符
删除一个字符
替换一个字符
示例 1：
输入：word1 = "horse", word2 = "ros"
输出：3
解释： horse -> rorse (将 'h' 替换为 'r') rorse -> rose (删除 'r') rose -> ros (删除 'e')
示例 2：
输入：word1 = "intention", word2 = "execution"
输出：5
解释： intention -> inention (删除 't') inention -> enention (将 'i' 替换为 'e') enention -> exention (将 'n' 替换为 'x') exention -> exection (将 'n' 替换为 'c') exection -> execution (插入 'u')

提示：

0 <= word1.length, word2.length <= 500
word1 和 word2 由小写英文字母组成

第一步确定dp数组以及下标的含义：

dp $i$ $j$ 表示以下标i-1为结尾的字符串word1，和以下标j-1为结尾的字符串word2，最近编辑距离为dp $i$ $j$ 。

第二步确定递推公式：

if (word1[i - 1] == word2[j - 1]) 那么说明不用任何编辑，dp[i][j] 就应该是 dp[i - 1][j - 1]，即dp[i][j] = dp[i - 1][j - 1];

if (word1[i - 1] != word2[j - 1])，此时就需要编辑了，如何编辑呢？

操作一：word1删除一个元素，那么就是以下标i - 2为结尾的word1 与 j-1为结尾的word2的最近编辑距离再加上一个操作。

即 dp[i][j] = dp[i - 1][j] + 1;

操作二：word2删除一个元素，那么就是以下标i - 1为结尾的word1 与 j-2为结尾的word2的最近编辑距离再加上一个操作。

即 dp[i][j] = dp[i][j - 1] + 1;

操作三：替换元素，word1替换word1[i - 1]，使其与word2[j - 1]相同，此时不用增删加元素。

可以回顾一下，if (word1[i - 1] == word2[j - 1])的时候我们的操作是 dp[i][j] = dp[i - 1][j - 1] 对吧。

那么只需要一次替换的操作，就可以让 word1 $i - 1$ 和 word2 $j - 1$ 相同。

所以 dp[i][j] = dp[i - 1][j - 1] + 1;

第三步 dp数组如何初始化：

dp $i$ $0$ ：以下标i-1为结尾的字符串word1，和空字符串word2，最近编辑距离为dp $i$ $0$ 。

那么dp $i$ $0$ 就应该是i，对word1里的元素全部做删除操作，即：dp $i$ $0$ = i;

同理dp $0$ $j$ = j;

第四步确定遍历顺序：

从如下四个递推公式：

dp[i][j] = dp[i - 1][j - 1]
dp[i][j] = dp[i - 1][j - 1] + 1
dp[i][j] = dp[i][j - 1] + 1
dp[i][j] = dp[i - 1][j] + 1

可以看出dp $i$ $j$ 是依赖左方，上方和左上方元素

python 复制代码

class Solution:
    def minDistance(self, word1: str, word2: str) -> int:
        dp = [[0] * (len(word2)+1) for _ in range(len(word1)+1)]
        for i in range(len(word1)+1):
            dp[i][0] = i
        for j in range(len(word2)+1):
            dp[0][j] = j
        for i in range(1, len(word1)+1):
            for j in range(1, len(word2)+1):
                if word1[i-1] == word2[j-1]:
                    dp[i][j] = dp[i-1][j-1]
                else:
                    dp[i][j] = min(dp[i-1][j-1], dp[i-1][j], dp[i][j-1]) + 1
        return dp[-1][-1]