动态规划Day1学习心得

今天开始学习动态规划的内容。

什么是动态规划

动态规划,英文:Dynamic Programming,简称DP,如果某一问题有很多重叠子问题,使用动态规划是最有效的。

所以动态规划中每一个状态一定是由上一个状态推导出来的,这一点就区分于贪心,贪心没有状态推导,而是从局部直接选最优的,

例如:有N件物品和一个最多能背重量为W 的背包。第i件物品的重量是weighti,得到的价值是valuei每件物品只能用一次,求解将哪些物品装入背包里物品价值总和最大。

动态规划中dpj是由dpj-weight\[i]推导出来的,然后取max(dpj, dpj - weight\[i] + valuei)。

但如果是贪心呢,每次拿物品选一个最大的或者最小的就完事了,和上一个状态没有关系。

所以贪心解决不了动态规划的问题。

动规是由前一个状态推导出来的,而贪心是局部直接选最优的。

动态规划的解题步骤

状态转移公式(递推公式)是很重要,但动规不仅仅只有递推公式。

  1. 确定dp数组(dp table)以及下标的含义
  2. 确定递推公式
  3. dp数组如何初始化
  4. 确定遍历顺序
  5. 举例推导dp数组

第一道:509. 斐波那契数 - 力扣(LeetCode)

cpp 复制代码
class Solution {
public:
    int fib(int N) {
        if (N <= 1) return N;
        vector<int> dp(N + 1);
        dp[0] = 0;
        dp[1] = 1;
        for (int i = 2; i <= N; i++) {
            dp[i] = dp[i - 1] + dp[i - 2];
        }
        return dp[N];
    }
};

前面的题目都比较简单,大家看一看代码应该就能明白。

第二道:70. 爬楼梯 - 力扣(LeetCode)

dpi = dpi - 1 + dpi - 2

cpp 复制代码
class Solution {
public:
    int climbStairs(int n) {
        if (n <= 1) return n; // 因为下面直接对dp[2]操作了,防止空指针
        vector<int> dp(n + 1);
        dp[1] = 1;
        dp[2] = 2;
        for (int i = 3; i <= n; i++) { // 注意i是从3开始的
            dp[i] = dp[i - 1] + dp[i - 2];
        }
        return dp[n];
    }
};

第三道:746. 使用最小花费爬楼梯 - 力扣(LeetCode)

这道题目需要注意每一次爬楼梯都有一个花费的问题,需要修改一下转移方程。

dpi = min(dpi - 1 + costi - 1, dpi - 2 + costi - 2)

cpp 复制代码
class Solution {
public:
    int minCostClimbingStairs(vector<int>& cost) {
        vector<int> dp(cost.size() + 1);
        dp[0] = 0; // 默认第一步都是不花费体力的
        dp[1] = 0;
        for (int i = 2; i <= cost.size(); i++) {
            dp[i] = min(dp[i - 1] + cost[i - 1], dp[i - 2] + cost[i - 2]);
        }
        return dp[cost.size()];
    }
};

第四道:62. 不同路径 - 力扣(LeetCode)

这道题目也很简单,有点小学奥数的感觉。

dpij = dpi - 1j + dpij - 1

cpp 复制代码
class Solution {
public:
    int uniquePaths(int m, int n) {
        vector<vector<int>> dp(m, vector<int>(n, 0));
        for (int i = 0; i < m; i++) dp[i][0] = 1;
        for (int j = 0; j < n; j++) dp[0][j] = 1;
        for (int i = 1; i < m; i++) {
            for (int j = 1; j < n; j++) {
                dp[i][j] = dp[i - 1][j] + dp[i][j - 1];
            }
        }
        return dp[m - 1][n - 1];
    }
};

然后是变题:63. 不同路径 II - 力扣(LeetCode)

这道题目的思路与上一道相似,但是要针对障碍修改初始化条件,同时需要注意第一排和第一列,一旦遇到障碍,后面的或者是下面的地方都再也无法到达。

cpp 复制代码
class Solution {
public:
    int uniquePathsWithObstacles(vector<vector<int>>& obstacleGrid) {
        int m = obstacleGrid.size();
        int n = obstacleGrid[0].size();
        if (obstacleGrid[m - 1][n - 1] == 1 || obstacleGrid[0][0] == 1) //如果在起点或终点出现了障碍,直接返回0
            return 0;
        vector<vector<int>> dp(m, vector<int>(n, 0));
        for (int i = 0; i < m && obstacleGrid[i][0] == 0; i++) dp[i][0] = 1;
        for (int j = 0; j < n && obstacleGrid[0][j] == 0; j++) dp[0][j] = 1;
        for (int i = 1; i < m; i++) {
            for (int j = 1; j < n; j++) {
                if (obstacleGrid[i][j] == 1) continue;
                dp[i][j] = dp[i - 1][j] + dp[i][j - 1];
            }
        }
        return dp[m - 1][n - 1];
    }

然后是第六道:343. 整数拆分 - 力扣(LeetCode)

这道题有点反直觉,看一下动态规划的分析。

动规五部曲,分析如下:

  1. 确定dp数组(dp table)以及下标的含义

dpi:分拆数字i,可以得到的最大乘积为dpi

dpi的定义将贯彻整个解题过程,下面哪一步想不懂了,就想想dpi究竟表示的是啥!

  1. 确定递推公式

可以想 dpi最大乘积是怎么得到的呢?

其实可以从1遍历j,然后有两种渠道得到dpi.

一个是j * (i - j) 直接相乘。

一个是j * dpi - j,相当于是拆分(i - j),对这个拆分不理解的话,可以回想dp数组的定义。

j是从1开始遍历,拆分j的情况,在遍历j的过程中其实都计算过了。那么从1遍历j,比较(i - j) * j和dpi - j * j 取最大的。递推公式:dpi = max(dpi, max((i - j) * j, dpi - j * j));

也可以这么理解,j * (i - j) 是单纯的把整数拆分为两个数相乘,而j * dpi - j是拆分成两个以及两个以上的个数相乘。

如果定义dpi - j * dpj 也是默认将一个数强制拆成4份以及4份以上了。

所以递推公式:dpi = max({dpi, (i - j) * j, dpi - j * j});

那么在取最大值的时候,为什么还要比较dpi呢?

因为在递推公式推导的过程中,每次计算dpi,取最大的而已。

  1. dp的初始化

dp0 dp1应该初始化多少呢?

有的题解里会给出dp0 = 1,dp1 = 1的初始化,但解释比较牵强,主要还是因为这么初始化可以把题目过了。

严格从dpi的定义来说,dp0 dp1 就不应该初始化,也就是没有意义的数值。

拆分0和拆分1的最大乘积是多少?

这是无解的。

这里只初始化dp2 = 1,从dpi的定义来说,拆分数字2,得到的最大乘积是1,这个没有任何异议!

  1. 确定遍历顺序

确定遍历顺序,先来看看递归公式:dpi = max(dpi, max((i - j) * j, dpi - j * j));

dpi 是依靠 dpi - j的状态,所以遍历i一定是从前向后遍历,先有dpi - j再有dpi

所以遍历顺序为:

复制代码
for (int i = 3; i <= n ; i++) {
    for (int j = 1; j < i - 1; j++) {
        dp[i] = max(dp[i], max((i - j) * j, dp[i - j] * j));
    }
}

注意 枚举j的时候,是从1开始的。从0开始的话,那么让拆分一个数拆个0,求最大乘积就没有意义了。

j的结束条件是 j < i - 1 ,其实 j < i 也是可以的,不过可以节省一步,例如让j = i - 1,的话,其实在 j = 1的时候,这一步就已经拆出来了,重复计算,所以 j < i - 1

至于 i是从3开始,这样dpi - j就是dp2正好可以通过我们初始化的数值求出来。

更优化一步,可以这样:

复制代码
for (int i = 3; i <= n ; i++) {
    for (int j = 1; j <= i / 2; j++) {
        dp[i] = max(dp[i], max((i - j) * j, dp[i - j] * j));
    }
}

因为拆分一个数n 使之乘积最大,那么一定是拆分成m个近似相同的子数相乘才是最大的。

例如 6 拆成 3 * 3, 10 拆成 3 * 3 * 4。 100的话 也是拆成m个近似数组的子数 相乘才是最大的。

只不过我们不知道m究竟是多少而已,但可以明确的是m一定大于等于2,既然m大于等于2,也就是 最差也应该是拆成两个相同的 可能是最大值。

那么 j 遍历,只需要遍历到 n/2 就可以,后面就没有必要遍历了,一定不是最大值。

至于 "拆分一个数n 使之乘积最大,那么一定是拆分成m个近似相同的子数相乘才是最大的" 这个我就不去做数学证明了,感兴趣的同学,可以自己证明。

  1. 举例推导dp数组

举例当n为10 的时候,dp数组里的数值,如下:

以上动规五部曲分析完毕,C++代码如下:

cpp 复制代码
class Solution {
public:
    int integerBreak(int n) {
        vector<int> dp(n + 1);
        dp[2] = 1;
        for (int i = 3; i <= n ; i++) {
            for (int j = 1; j <= i / 2; j++) {
                dp[i] = max(dp[i], max((i - j) * j, dp[i - j] * j));
            }
        }
        return dp[n];
    }
};

然后看最后一道:96. 不同的二叉搜索树 - 力扣(LeetCode)

  1. 确定dp数组(dp table)以及下标的含义

dpi : 1到i为节点组成的二叉搜索树的个数为dpi

也可以理解是i个不同元素节点组成的二叉搜索树的个数为dpi ,都是一样的。

以下分析如果想不清楚,就来回想一下dpi的定义

  1. 确定递推公式

在上面的分析中,其实已经看出其递推关系, dpi += dp以j为头结点左子树节点数量 * dp以j为头结点右子树节点数量

j相当于是头结点的元素,从1遍历到i为止。

所以递推公式:dpi += dpj - 1 * dpi - j; ,j-1 为j为头结点左子树节点数量,i-j 为以j为头结点右子树节点数量

  1. dp数组如何初始化

初始化,只需要初始化dp0就可以了,推导的基础,都是dp0

那么dp0应该是多少呢?

从定义上来讲,空节点也是一棵二叉树,也是一棵二叉搜索树,这是可以说得通的。

从递归公式上来讲,dp以j为头结点左子树节点数量 * dp以j为头结点右子树节点数量 中以j为头结点左子树节点数量为0,也需要dp以j为头结点左子树节点数量 = 1, 否则乘法的结果就都变成0了。

所以初始化dp0 = 1

  1. 确定遍历顺序

首先一定是遍历节点数,从递归公式:dpi += dpj - 1 * dpi - j可以看出,节点数为i的状态是依靠 i之前节点数的状态。

那么遍历i里面每一个数作为头结点的状态,用j来遍历。

代码如下:

复制代码
for (int i = 1; i <= n; i++) {
    for (int j = 1; j <= i; j++) {
        dp[i] += dp[j - 1] * dp[i - j];
    }
}
  1. 举例推导dp数组

n为5时候的dp数组状态如图:

当然如果自己画图举例的话,基本举例到n为3就可以了,n为4的时候,画图已经比较麻烦了。

我这里列到了n为5的情况,是为了方便大家 debug代码的时候,把dp数组打出来,看看哪里有问题

综上分析完毕,C++代码如下:

cpp 复制代码
class Solution {
public:
    int numTrees(int n) {
        vector<int> dp(n + 1);
        dp[0] = 1;
        for (int i = 1; i <= n; i++) {
            for (int j = 1; j <= i; j++) {
                dp[i] += dp[j - 1] * dp[i - j];
            }
        }
        return dp[n];
    }
};
相关推荐
随意起个昵称1 小时前
区间dp-基础题目1(石子合并)
算法·动态规划
吞下星星的少年·-·2 小时前
线段树模板
算法
段一凡-华北理工大学2 小时前
2026 高炉炼铁智能化技术全景与演进路径~系列文章11:演进路径与行业未来
大数据·网络·人工智能·算法·工业智能体·高炉炼铁智能化
叶小鸡3 小时前
小鸡玩算法-力扣HOT100-多维动态规划
算法·leetcode·动态规划
星马梦缘3 小时前
aaaaa
数据结构·c++·算法
菜菜的顾清寒3 小时前
力扣HOT100(42)链表-随机链表的复制
算法·leetcode·链表
lqqjuly4 小时前
模型剪枝与稀疏化:理论、算法与可运行实现
人工智能·算法·剪枝
逻辑君4 小时前
Foresight研究报告【20260011】
人工智能·线性代数·算法·矩阵
珊瑚里的鱼4 小时前
【动态规划】不同路径Ⅱ
算法·动态规划
适应规律5 小时前
【无标题】
人工智能·python·算法