第五十五天| 583. 两个字符串的删除操作、72. 编辑距离

Leetcode 583. 两个字符串的删除操作

题目链接:583 两个字符串的删除操作

题干: 给定两个单词 word1word2 ,返回使得 word1word2相同 所需的最小步数

每步可以删除任意一个字符串中的一个字符。

**思考:**动态规划。本题中的步数可以看作删除字母,使得两单词最终处理为相同字母组。

  • 确定dp数组(dp table)以及下标的含义

dpij:使得 以i - 1结尾的单词word1和以j - 1结尾的单词word2 相同所需的最小步数。

  • 确定递推公式

从dpij的定义可以看出,字母比较就两种情况

  • 当word1i - 1 与 word2j - 1相同的时候
  • 当word1i - 1 与 word2j - 1不相同的时候

当word1i - 1 与 word2j - 1相同的时候,dpij = dpi - 1j - 1;

当word1i - 1 与 word2j - 1不相同的时候,有三种情况:

情况一:删word1i - 1,最少操作次数为dpi - 1j + 1

情况二:删word2j - 1,最少操作次数为dpij - 1 + 1

情况三:同时删word1i - 1和word2j - 1,最少的操作次数为dpi - 1j - 1 + 2

当然要取最小值,所以当word1i - 1 与 word2j - 1不相同的时候,递推公式:dpij = min({dpi - 1j - 1 + 2, dpi - 1j + 1, dpij - 1 + 1});

又因为 dpij - 1 + 1 = dpi - 1j - 1 + 2,所以递推公式可简化为:dpij = min(dpi - 1j + 1, dpij - 1 + 1);

  • dp数组如何初始化

从递推公式中,可以看出来,dpi0 和 dp0j是一定要初始化的。

dpi0:word2为空字符串,以i-1为结尾的字符串word1要删除多少个元素,才能和word2相同呢,很明显dpi0 = i。同理 dp0j = j。

  • 确定遍历顺序

从递推公式 dpij = min(dpi - 1j, dpij - 1) + 1; 和dpij = dpi - 1j - 1可以看出dpij都是根据左上方、正上方、正左方推出来的。

所以遍历的时候一定是从上到下,从左到右,这样保证dpij可以根据之前计算出来的数值进行计算。

  • 举例推导dp数组

举例:word1:"sea",word2:"eat",推导dp数组状态图如下:

代码:

cpp 复制代码
class Solution {
public:
    int minDistance(string word1, string word2) {
        //dp[i][j]:使得 以i - 1结尾的单词word1和以j - 1结尾的单词word2 相同所需的最小步数 
        vector<vector<int>> dp(word1.size() + 1, vector<int>(word2.size() + 1));
        for (int i = 1; i <= word1.size(); i++)     //单词word2为空的情况
            dp[i][0] = i;
        for (int j = 1; j <= word2.size(); j++)     //单词word1为空的情况
            dp[0][j] = j;

        for (int i = 1; i <= word1.size(); i++) {           //遍历单词word1
            for(int j = 1; j <= word2.size(); j++) {        //遍历单词word2
                if (word1[i - 1] == word2[j - 1])
                    dp[i][j] = dp[i - 1][j - 1];        //字母相同则无需无需删除字母
                else
                    dp[i][j] = min(dp[i][j - 1], dp[i - 1][j]) + 1;     //字母不相同则选一单词删除字母,取最小值
            }
        }
        return dp[word1.size()][word2.size()];
    }
};

思考: 动态规划。本题也可以从求公共子序列入手,要删除的元素个数(即步数)为两单词长度减去两倍公共子序列长度。具体如何求公共子序列:1143 最长公共子序列

代码:

cpp 复制代码
class Solution {
public:
    int minDistance(string word1, string word2) {
        //dp[i][j]:单词word1的处理区间[0, i - 1]与单词word2的处理区间[0, j - 1]中,存在的最长公共子序列的长度
        vector<vector<int>> dp(word1.size() + 1, vector<int>(word2.size() + 1, 0));     

        for (int i = 1; i <= word1.size(); i++) {           //遍历单词word1
            for (int j = 1; j <= word2.size(); j++) {       //遍历单词word2
                if (word1[i - 1] == word2[j - 1])
                    //当前处理两字母相等 则 取两单词均缩小处理区间的最长公共子序列长度加一
                    dp[i][j] = dp[i - 1][j - 1] + 1;        
                else 
                    //当前处理两字母不相等 则 取任选一单词缩小处理区间的最长公共子序列长度,两长度中的较大值
                    dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]);     
            }
        }
        return word1.size() + word2.size() - 2 * dp[word1.size()][word2.size()];        //两单词去除最长公共子序列
    }
};

Leetcode 72. 编辑距离

题目链接:72 编辑距离

题干: 给你两个单词 word1word2请返回将 word1 转换成 word2 所使用的最少操作数 。你可以对一个单词进行如下三种操作:

  • 插入一个字符
  • 删除一个字符
  • 替换一个字符

**思考:**动态规划。本题要先想清楚:真正要求的是将word1和word2变成相同单词的操作次数。

题干中删除word1字母的操作 可以等价为 插入word2字母的操作;插入word1字母的操作 可以等价为 删除word2字母的操作。下面就直接考虑删除操作不考虑插入操作。

因此本题与上题的区别在 确定递推公式中:

当word1i - 1 与 word2j - 1不相同的时候,有不同的三种操作:

情况一:删word1i - 1,最少操作次数为dpi - 1j + 1

情况二:删word2j - 1(同向word1中插入),最少操作次数为dpij - 1 + 1

情况三:替换word1i - 1,最少的操作次数为dpi - 1j - 1 + 1

当然要取最小值,所以当word1i - 1 与 word2j - 1不相同的时候,递推公式:dpij = min({dpi - 1j - 1 + 1, dpi - 1j + 1, dpij - 1 + 1});

代码:

cpp 复制代码
class Solution {
public:
    int minDistance(string word1, string word2) {
        //dp[i][j]:对以i- 1结尾的单词word1和以j - 1结尾的单词word2操作,让处理后两单词相同的最少操作次数
        vector<vector<int>> dp(word1.size() + 1, vector<int>(word2.size() + 1));
        
        for (int i = 0; i <= word1.size(); i++)     //单词word2为空的情况
            dp[i][0] = i;
        for (int j = 1; j <= word2.size(); j++)     //单词word1为空的情况
            dp[0][j] = j;

        for (int i = 1; i <= word1.size(); i++) {           //遍历单词word1
            for (int j = 1; j <= word2.size(); j++) {       //遍历单词word2
                if (word1[i - 1] == word2[j - 1])
                    //当前两字母相同则不用处理
                    dp[i][j] = dp[i - 1][j - 1];    
                else
                    //当前两字母不同则考虑替换word1的字母,删除word1的字母以及删除word2的字母
                    dp[i][j] = min(dp[i - 1][j - 1], min(dp[i - 1][j], dp[i][j -1])) + 1;
            }
        }
        return dp[word1.size()][word2.size()];
    }
};

自我总结:

理解公共子序列问题的关键在于删除操作,两字符串的操作含义同dp数组的含义变化而变化。动态规划是在每次操作中考虑每种情况,统一处理。

相关推荐
叁散13 小时前
ESP32 LCD1602显示实验报告
算法
过期动态13 小时前
【LeetCode 热题 100】盛最多水的容器
java·数据结构·spring boot·算法·leetcode·spring cloud·职场和发展
凌波粒13 小时前
LeetCode--700.二叉搜索树中的搜索(二叉树)
算法·leetcode·职场和发展
君为先-bey13 小时前
LeMiCa——基于扩散模型的高效视频生成的词典序最小化路径缓存
python·算法·机器学习·扩散模型
洛水水13 小时前
【力扣100题】58.轮转数组
算法·leetcode
资深流水灯工程师13 小时前
LMS 最小均方算法在 DSP 上的 C 语言实现
算法
风筝在晴天搁浅14 小时前
阿里 LeetCode 876.链表的中间节点
算法·leetcode·链表
玖釉-14 小时前
二叉树展开为链表:从先序遍历到原地指针重排
c++·windows·算法·leetcode·链表
05候补工程师14 小时前
【408考研·数据结构专题】二叉树、树与森林、线索树及哈夫曼树核心考点与秒杀技巧深度总结
数据结构·经验分享·笔记·考研·算法
吃好睡好便好14 小时前
矩阵的加减运算
开发语言·人工智能·学习·线性代数·算法·matlab·矩阵