算法——动态规划

1. 什么是动态规划?

动态规划(Dynamic Programming)是一种解决多阶段决策问题的优化方法。它通常用于解决具有重叠子问题和最优子结构性质的问题,能够将一个大问题分解为多个重叠的子问题,并通过存储子问题的解来避免重复计算,从而提高算法效率。

动态规划的基本思想是将原问题分解为若干子问题,先求解子问题的解,然后将这些子问题的解组合起来,逐步推导出原问题的解。为了避免重复计算,动态规划算法通常采用表格(数组)来存储已经求解的子问题的解,这种表格通常称为动态规划(dp)表。

2. 动态规划算法的解题流程

动态规划算法的一般步骤如下:

  1. 定义状态: 明确定义问题的状态,将原问题转化为具有重叠子问题的子问题。在解题中体现为确认dp表中每一个格子表示什么。

  2. 找到状态转移方程: 建立子问题之间的递推关系,通过状态转移方程描述问题的最优子结构。在解题中体现为dp表如何去填写。

  3. 初始化: 初始化动态规划表,将边界状态的值填入表中。在解题中,初始化的目的是为了保证最后得到的结果是正确的。

  4. 逐步计算: 从边界状态开始,按照状态转移方程逐步计算并填充动态规划表。在解题中,体现为确认填dp表的方向。

  5. 解读结果: 根据动态规划表中的结果得到原问题的解。在解题中,体现为返回正确结果。

3. 应用实例

①斐波那契数列模型

1. 第N个泰波那契数

题目链接:1137. 第 N 个泰波那契数 - 力扣(LeetCode)

解析:看完这道题,我们分析这个题目可以发现,题目已经将几乎动态规划的所有步骤告诉了我们,我们只需要按照他说的完成流程即可,我们定义dp[i]表示第i个泰波那契数,我们的动态转移方程为 dp[i] = dp[i-1] + dp[i-2] + dp[i-3],而初始化要想得到正确结果,我们需要将dp[0] = 0, dp[1] = dp[2] = 1,填表方向则是从左向右从第3个位置开始填,最后返回dp[n]即可(n为0,1,2时需要进行特殊判断),代码如下

cpp 复制代码
class Solution 
{
public:
    int tribonacci(int n) 
    {
        if (n == 0) return 0;
        if (n <= 2) return 1;
        vector<int> dp(n+1);
        dp[1] = dp[2] = 1;

        for (int i = 3; i <= n; i++)
            dp[i] = dp[i-1] + dp[i-2] + dp[i-3];

        return dp[n];
    }
};

2. 三步问题

题目链接:面试题 08.01. 三步问题 - 力扣(LeetCode)

解析:分析这个题目,我们可以创建一个大小为(n+1)的dp表,我们定义dp[i]为到小孩上到第i个阶梯共有多少种方式,根据题目我们可以发现,要想到达dp[i]这个位置,我们有三种方法上来,分别是从前三个位置上来,即

所以我们可以得到dp[i]的动态转移方程:dp[i] = dp[i-1] + dp[i-2] + dp[i-3],初始化时,只有前三个台阶需要特殊处理,由于一开始就处于第0个台阶因此dp[0]=1,到第一个台阶只有一种方法,所以dp[1] = 1,到第二个台阶有2种方法,所以dp[2] = 2,由于题目中是从下往上跳,因此填表顺序为从第三个台阶开始从左向右填,最终返回dp[n]即可,代码如下

cpp 复制代码
class Solution 
{
public:
    int waysToStep(int n) 
    {
        if (n <= 1) return 1;
        if (n == 2) return 2;

        int mod = 1e9 + 7;
        vector<long long> dp(n+1);
        dp[0] = dp[1] = 1;
        dp[2] = 2;

        for (int i = 3; i <= n; i++)
            dp[i] = (dp[i-1] + dp[i-2] + dp[i-3]) % mod;
        
        return dp[n];
    }
};

3. 使用最小花费爬楼梯

题目链接:746. 使用最小花费爬楼梯 - 力扣(LeetCode)

解析:分析题目,我们可以定义dp[i]表示到第i个阶梯的最小花费,而要想到达第i个阶梯,要么只能从第i-1个阶梯来,要么只能从i-2个阶梯来,我们只需要最小的花费,所以动态转移方程如下 dp[i] = min(dp[i-1] + cost[i-1], dp[i-2] + cost[i-2]);,由于可以选择下标从0或1的阶梯开始爬,因此我们无需初始化,填表顺序为从前往后填,最后返回dp[n]即可,代码如下

cpp 复制代码
class Solution 
{
public:
    int minCostClimbingStairs(vector<int>& cost) 
    {
        int n = cost.size();
        vector<int> dp(n+1);

        for(int i = 2; i <= n; i++)
            dp[i] = min(dp[i-1] + cost[i-1], dp[i-2] + cost[i-2]);

        return dp[n];
    }
};

除了从左向右填表外,我们还可以从右向左填表,定义dp[i]表示从第i个阶梯开始到达楼顶的最小花费,从第i个阶梯向后移动,要么只能移动一步要么只能移动两步,我们需要得到其中较小的一种情况,因此有 dp[i] = min(dp[i+1], dp[i+2]) + cost[i],由于从倒数第一和倒数第二个阶梯都能直接到达楼顶,因此我们需要初始化dp[n-1] = cost[n-1], dp[n-2] = cost[n-2], 填表时从后往前填即可,最终返回dp[0]与dp[1]中的较小值,代码如下

cpp 复制代码
class Solution 
{
public:
    int minCostClimbingStairs(vector<int>& cost) 
    {
        int n = cost.size();
        vector<int> dp(n+1);
        dp[n-1] = cost[n-1];
        dp[n-2] = cost[n-2];

        for(int i = n - 3; i >= 0; i--)
            dp[i] = min(dp[i+1], dp[i+2]) + cost[i];

        return min(dp[0], dp[1]);
    }
};

4. 解码方法

题目链接:91. 解码方法 - 力扣(LeetCode)

解析:分析这个题目,我们可以定义dp[i]表示到达第i个字符时共有多少种解码方法,若当前单个字符能够解码(不为'0'),则表明当前字符是一种解码方法,此时该字符可以与前面的串形成一种编码即dp[i-1],若当前字符不能够解码(为'0'),则表明当前字符不是一种解码方式,此时dp[i]就置为0;若当前字符能与前一个字符进行解码,则表明这两个字符是一种解码方法,即dp[i-2],若不能形成,则dp[i]置于0,对于初始化我们只需要知道第一个字符是否为'0'即可,是的话dp[0] = 0,不是的话dp[0] = 1,dp[1]有0,1,2三种情况,填表顺序为从左往右填,最终返回dp[n-1]即可,代码如下

cpp 复制代码
class Solution 
{
public:
    int numDecodings(string s) 
    {
        int n = s.size();
        vector<int> dp(n);
        if (s[0] != '0') dp[0] = 1;
        if (n == 1) return dp[0];

        int code = stoi(s.substr(0, 2));
        if (s[1] != '0' && s[0] != '0') dp[1]++;
        if (code >= 10 && code <= 26) dp[1]++; 
            
        for (int i = 2; i < n; i++)
        {
            if (s[i] != '0') dp[i] += dp[i-1];
            code = stoi(s.substr(i-1, 2));
            if (code >= 10 && code <= 26) dp[i] += dp[i-2];
        }

        return dp[n-1];
    }
};

②路径问题

1. 不同路径

题目链接:62. 不同路径 - 力扣(LeetCode)

解析:分析题目,我们可以规定dp[i][j]表示到达(i, j)位置的所有路径数,由于机器人每次只能向下或者向右移动,因此对于一个dp[i][j]它只能从左侧过来,或者从上方下来,即 dp[i][j] = dp[i-1][j] + dp[i][j-1],为了免除边界处理的情况,我们可以人为的为dp表填上一行,防止i-1与j-1越界,即直接初始化dp大小为(m+1)*(n+1),此时要注意,由于我们添加了一行因此原数组的位置的映射关系发生了改变,即dp[i][j]表示的是到达(i-1, j-1)位置的路径数,为了保证结果的正确我们可以挑选dp[0][1] = 1 或者 dp[1][0] = 1,填表顺序为从左向右,从上至下,最后返回dp[m][n]即可,代码如下

cpp 复制代码
class Solution 
{
public:
    int uniquePaths(int m, int n) 
    {
        vector<vector<int>> dp(m+1, vector<int>(n+1));
        dp[0][1] = 1;

        for (int i = 1; i <= m; i++)
            for (int j = 1; j <= n; j++)
                dp[i][j] = dp[i-1][j] + dp[i][j-1];

        return dp[m][n];
    }
};

2. 不同路径Ⅱ

题目链接:63. 不同路径 II - 力扣(LeetCode)

解析:这道题整体的思路与上一题类似,但是这道题在遇见1的时候是到达不了这个地方的,此时将该位置置为0即可(注意下标间的映射为dp[i][j]对应ob[i-1][j-1]),代码如下

cpp 复制代码
class Solution 
{
public:
    int uniquePathsWithObstacles(vector<vector<int>>& obstacleGrid) 
    {
        int m = obstacleGrid.size();
        int n = obstacleGrid[0].size();
        vector<vector<int>> dp(m+1, vector<int>(n+1));
        dp[0][1] = 1;

        for (int i = 1; i <= m; i++)
            for (int j = 1; j <= n; j++)
                if (obstacleGrid[i-1][j-1] == 1) dp[i][j] = 0;
                else dp[i][j] = dp[i-1][j] + dp[i][j-1];

        return dp[m][n];
    }
};
相关推荐
不去幼儿园24 分钟前
【MARL】深入理解多智能体近端策略优化(MAPPO)算法与调参
人工智能·python·算法·机器学习·强化学习
Mr_Xuhhh26 分钟前
重生之我在学环境变量
linux·运维·服务器·前端·chrome·算法
盼海1 小时前
排序算法(五)--归并排序
数据结构·算法·排序算法
网易独家音乐人Mike Zhou5 小时前
【卡尔曼滤波】数据预测Prediction观测器的理论推导及应用 C语言、Python实现(Kalman Filter)
c语言·python·单片机·物联网·算法·嵌入式·iot
Swift社区8 小时前
LeetCode - #139 单词拆分
算法·leetcode·职场和发展
Kent_J_Truman9 小时前
greater<>() 、less<>()及运算符 < 重载在排序和堆中的使用
算法
IT 青年10 小时前
数据结构 (1)基本概念和术语
数据结构·算法
Dong雨10 小时前
力扣hot100-->栈/单调栈
算法·leetcode·职场和发展
SoraLuna10 小时前
「Mac玩转仓颉内测版24」基础篇4 - 浮点类型详解
开发语言·算法·macos·cangjie
liujjjiyun10 小时前
小R的随机播放顺序
数据结构·c++·算法