动态规划基础思想

本页面主要介绍了动态规划的基本思想,以及动态规划中状态及状态转移方程的设计思路,帮助各位初学者对动态规划有一个初步的了解。

本部分的其他页面,将介绍各种类型问题中动态规划模型的建立方法,以及一些动态规划的优化技巧。

引入

[IOI1994] 数字三角形](www.luogu.com.cn/problem/P12...)" 给定一个 <math xmlns="http://www.w3.org/1998/Math/MathML"> r r </math>r 行的数字三角形( <math xmlns="http://www.w3.org/1998/Math/MathML"> r ≤ 1000 r \leq 1000 </math>r≤1000),需要找到一条从最高点到底部任意处结束的路径,使路径经过数字的和最大。每一步可以走到当前点左下方的点或右下方的点。

ruby 复制代码
```plain
        7 
      3   8 
    8   1   0 
  2   7   4   4 
4   5   2   6   5 
```

在上面这个例子中,最优路径是 $7 \to 3 \to 8 \to 7 \to 5$。

最简单粗暴的思路是尝试所有的路径。因为路径条数是 <math xmlns="http://www.w3.org/1998/Math/MathML"> O ( 2 r ) O(2^r) </math>O(2r) 级别的,这样的做法无法接受。

注意到这样一个事实,一条最优的路径,它的每一步决策都是最优的。

以例题里提到的最优路径为例,只考虑前四步 <math xmlns="http://www.w3.org/1998/Math/MathML"> 7 → 3 → 8 → 7 7 \to 3 \to 8 \to 7 </math>7→3→8→7,不存在一条从最顶端到 <math xmlns="http://www.w3.org/1998/Math/MathML"> 4 4 </math>4 行第 <math xmlns="http://www.w3.org/1998/Math/MathML"> 2 2 </math>2 个数的权值更大的路径。

而对于每一个点,它的下一步决策只有两种:往左下角或者往右下角(如果存在)。因此只需要记录当前点的最大权值,用这个最大权值执行下一步决策,来更新后续点的最大权值。

这样做还有一个好处:我们成功缩小了问题的规模,将一个问题分成了多个规模更小的问题。要想得到从顶端到第 <math xmlns="http://www.w3.org/1998/Math/MathML"> r r </math>r 行的最优方案,只需要知道从顶端到第 <math xmlns="http://www.w3.org/1998/Math/MathML"> r − 1 r-1 </math>r−1 行的最优方案的信息就可以了。

这时候还存在一个问题:子问题间重叠的部分会有很多,同一个子问题可能会被重复访问多次,效率还是不高。解决这个问题的方法是把每个子问题的解存储下来,通过记忆化的方式限制访问顺序,确保每个子问题只被访问一次。

上面就是动态规划的一些基本思路。下面将会更系统地介绍动态规划的思想。

动态规划原理

能用动态规划解决的问题,需要满足三个条件:最优子结构,无后效性和子问题重叠。

最优子结构

具有最优子结构也可能是适合用贪心的方法求解。

注意要确保我们考察了最优解中用到的所有子问题。

  1. 证明问题最优解的第一个组成部分是做出一个选择;
  2. 对于一个给定问题,在其可能的第一步选择中,假定你已经知道哪种选择才会得到最优解。你现在并不关心这种选择具体是如何得到的,只是假定已经知道了这种选择;
  3. 给定可获得的最优解的选择后,确定这次选择会产生哪些子问题,以及如何最好地刻画子问题空间;
  4. 证明作为构成原问题最优解的组成部分,每个子问题的解就是它本身的最优解。方法是反证法,考虑加入某个子问题的解不是其自身的最优解,那么就可以从原问题的解中用该子问题的最优解替换掉当前的非最优解,从而得到原问题的一个更优的解,从而与原问题最优解的假设矛盾。

要保持子问题空间尽量简单,只在必要时扩展。

最优子结构的不同体现在两个方面:

  1. 原问题的最优解中涉及多少个子问题;
  2. 确定最优解使用哪些子问题时,需要考察多少种选择。

子问题图中每个定点对应一个子问题,而需要考察的选择对应关联至子问题顶点的边。

无后效性

已经求解的子问题,不会再受到后续决策的影响。

子问题重叠

如果有大量的重叠子问题,我们可以用空间将这些子问题的解存储下来,避免重复求解相同的子问题,从而提升效率。

基本思路

对于一个能用动态规划解决的问题,一般采用如下思路解决:

  1. 将原问题划分为若干 阶段 ,每个阶段对应若干个子问题,提取这些子问题的特征(称之为 状态);
  2. 寻找每一个状态的可能 决策 ,或者说是各状态间的相互转移方式(用数学的语言描述就是 状态转移方程)。
  3. 按顺序求解每一个阶段的问题。

如果用图论的思想理解,我们建立一个 有向无环图,每个状态对应图上一个节点,决策对应节点间的连边。这样问题就转变为了一个在 DAG 上寻找最长(短)路的问题(参见:DAG 上的 DP)。

最长公共子序列

???+ note "最长公共子序列问题" 给定一个长度为 <math xmlns="http://www.w3.org/1998/Math/MathML"> n n </math>n 的序列 <math xmlns="http://www.w3.org/1998/Math/MathML"> A A </math>A 和一个 长度为 <math xmlns="http://www.w3.org/1998/Math/MathML"> m m </math>m 的序列 <math xmlns="http://www.w3.org/1998/Math/MathML"> B B </math>B( <math xmlns="http://www.w3.org/1998/Math/MathML"> n , m ≤ 5000 n,m \leq 5000 </math>n,m≤5000),求出一个最长的序列,使得该序列既是 <math xmlns="http://www.w3.org/1998/Math/MathML"> A A </math>A 的子序列,也是 <math xmlns="http://www.w3.org/1998/Math/MathML"> B B </math>B 的子序列。

子序列的定义可以参考 子序列。一个简要的例子:字符串 abcde 与字符串 acde 的公共子序列有 acdeacadaecdcedeadeacecdeacde,最长公共子序列的长度是 4。

设 <math xmlns="http://www.w3.org/1998/Math/MathML"> f ( i , j ) f(i,j) </math>f(i,j) 表示只考虑 <math xmlns="http://www.w3.org/1998/Math/MathML"> A A </math>A 的前 <math xmlns="http://www.w3.org/1998/Math/MathML"> i i </math>i 个元素, <math xmlns="http://www.w3.org/1998/Math/MathML"> B B </math>B 的前 <math xmlns="http://www.w3.org/1998/Math/MathML"> j j </math>j 个元素时的最长公共子序列的长度,求这时的最长公共子序列的长度就是 子问题 。 <math xmlns="http://www.w3.org/1998/Math/MathML"> f ( i , j ) f(i,j) </math>f(i,j) 就是我们所说的 状态 ,则 <math xmlns="http://www.w3.org/1998/Math/MathML"> f ( n , m ) f(n,m) </math>f(n,m) 是最终要达到的状态,即为所求结果。

对于每个 <math xmlns="http://www.w3.org/1998/Math/MathML"> f ( i , j ) f(i,j) </math>f(i,j),存在三种决策:如果 <math xmlns="http://www.w3.org/1998/Math/MathML"> A i = B j A_i=B_j </math>Ai=Bj,则可以将它接到公共子序列的末尾;另外两种决策分别是跳过 <math xmlns="http://www.w3.org/1998/Math/MathML"> A i A_i </math>Ai 或者 <math xmlns="http://www.w3.org/1998/Math/MathML"> B j B_j </math>Bj。状态转移方程如下:
<math xmlns="http://www.w3.org/1998/Math/MathML" display="block"> f ( i , j ) = { f ( i − 1 , j − 1 ) + 1 A i = B j max ⁡ ( f ( i − 1 , j ) , f ( i , j − 1 ) ) A i ≠ B j f(i,j)=\begin{cases}f(i-1,j-1)+1&A_i=B_j\\\max(f(i-1,j),f(i,j-1))&A_i\ne B_j\end{cases} </math>f(i,j)={f(i−1,j−1)+1max(f(i−1,j),f(i,j−1))Ai=BjAi=Bj

可参考 SourceForge 的 LCS 交互网页 来更好地理解 LCS 的实现过程。

该做法的时间复杂度为 <math xmlns="http://www.w3.org/1998/Math/MathML"> O ( n m ) O(nm) </math>O(nm)。

另外,本题存在 <math xmlns="http://www.w3.org/1998/Math/MathML"> O ( n m w ) O\left(\dfrac{nm}{w}\right) </math>O(wnm) 的算法^1^。有兴趣的同学可以自行探索。

cpp 复制代码
int a[MAXN], b[MAXM], f[MAXN][MAXM];

int dp() {
  for (int i = 1; i <= n; i++)
    for (int j = 1; j <= m; j++)
      if (a[i] == b[j])
        f[i][j] = f[i - 1][j - 1] + 1;
      else
        f[i][j] = std::max(f[i - 1][j], f[i][j - 1]);
  return f[n][m];
}

最长不下降子序列

???+ note "最长不下降子序列问题" 给定一个长度为 <math xmlns="http://www.w3.org/1998/Math/MathML"> n n </math>n 的序列 <math xmlns="http://www.w3.org/1998/Math/MathML"> A A </math>A( <math xmlns="http://www.w3.org/1998/Math/MathML"> n ≤ 5000 n \leq 5000 </math>n≤5000),求出一个最长的 <math xmlns="http://www.w3.org/1998/Math/MathML"> A A </math>A 的子序列,满足该子序列的后一个元素不小于前一个元素。

算法一

设 <math xmlns="http://www.w3.org/1998/Math/MathML"> f ( i ) f(i) </math>f(i) 表示以 <math xmlns="http://www.w3.org/1998/Math/MathML"> A i A_i </math>Ai 为结尾的最长不下降子序列的长度,则所求为 <math xmlns="http://www.w3.org/1998/Math/MathML"> max ⁡ 1 ≤ i ≤ n f ( i ) \max_{1 \leq i \leq n} f(i) </math>max1≤i≤nf(i)。

计算 <math xmlns="http://www.w3.org/1998/Math/MathML"> f ( i ) f(i) </math>f(i) 时,尝试将 <math xmlns="http://www.w3.org/1998/Math/MathML"> A i A_i </math>Ai 接到其他的最长不下降子序列后面,以更新答案。于是可以写出这样的状态转移方程: <math xmlns="http://www.w3.org/1998/Math/MathML"> f ( i ) = max ⁡ 1 ≤ j < i , A j ≤ A i ( f ( j ) + 1 ) f(i)=\max_{1 \leq j < i, A_j \leq A_i} (f(j)+1) </math>f(i)=max1≤j<i,Aj≤Ai(f(j)+1)。

容易发现该算法的时间复杂度为 <math xmlns="http://www.w3.org/1998/Math/MathML"> O ( n 2 ) O(n^2) </math>O(n2)。

=== "C++" ```cpp int a[MAXN], d[MAXN];

ini 复制代码
int dp() {
  d[1] = 1;
  int ans = 1;
  for (int i = 2; i <= n; i++) {
    d[i] = 1;
    for (int j = 1; j < i; j++)
      if (a[j] <= a[i]) {
        d[i] = max(d[i], d[j] + 1);
        ans = max(ans, d[i]);
      }
  }
  return ans;
}
```

=== "Python" python a = [0] * MAXN d = [0] * MAXN def dp(): d[1] = 1 ans = 1 for i in range(2, n + 1): for j in range(1, i): if a[j] <= a[i]: d[i] = max(d[i], d[j] + 1) ans = max(ans, d[i]) return ans

算法二^2^

当 <math xmlns="http://www.w3.org/1998/Math/MathML"> n n </math>n 的范围扩大到 <math xmlns="http://www.w3.org/1998/Math/MathML"> n ≤ 1 0 5 n \leq 10^5 </math>n≤105 时,第一种做法就不够快了,下面给出了一个 <math xmlns="http://www.w3.org/1998/Math/MathML"> O ( n log ⁡ n ) O(n \log n) </math>O(nlogn) 的做法。

回顾一下之前的状态: <math xmlns="http://www.w3.org/1998/Math/MathML"> ( i , l ) (i, l) </math>(i,l)。

但这次,我们不是要按照相同的 <math xmlns="http://www.w3.org/1998/Math/MathML"> i i </math>i 处理状态,而是直接判断合法的 <math xmlns="http://www.w3.org/1998/Math/MathML"> ( i , l ) (i, l) </math>(i,l)。

再看一下之前的转移: <math xmlns="http://www.w3.org/1998/Math/MathML"> ( j , l − 1 ) → ( i , l ) (j, l - 1) \rightarrow (i, l) </math>(j,l−1)→(i,l),就可以判断某个 <math xmlns="http://www.w3.org/1998/Math/MathML"> ( i , l ) (i, l) </math>(i,l) 是否合法。

初始时 <math xmlns="http://www.w3.org/1998/Math/MathML"> ( 1 , 1 ) (1, 1) </math>(1,1) 肯定合法。

那么,只需要找到一个 <math xmlns="http://www.w3.org/1998/Math/MathML"> l l </math>l 最大的合法的 <math xmlns="http://www.w3.org/1998/Math/MathML"> ( i , l ) (i, l) </math>(i,l),就可以得到最终最长不下降子序列的长度了。

那么,根据上面的方法,我们就需要维护一个可能的转移列表,并逐个处理转移。

所以可以定义 <math xmlns="http://www.w3.org/1998/Math/MathML"> a 1 ... a n a_1 \dots a_n </math>a1...an 为原始序列, <math xmlns="http://www.w3.org/1998/Math/MathML"> d i d_i </math>di 为所有的长度为 <math xmlns="http://www.w3.org/1998/Math/MathML"> i i </math>i 的不下降子序列的末尾元素的最小值, <math xmlns="http://www.w3.org/1998/Math/MathML"> l e n len </math>len 为子序列的长度。

初始化: <math xmlns="http://www.w3.org/1998/Math/MathML"> d 1 = a 1 , l e n = 1 d_1=a_1,len=1 </math>d1=a1,len=1。

现在我们已知最长的不下降子序列长度为 1,那么我们让 <math xmlns="http://www.w3.org/1998/Math/MathML"> i i </math>i 从 2 到 <math xmlns="http://www.w3.org/1998/Math/MathML"> n n </math>n 循环,依次求出前 <math xmlns="http://www.w3.org/1998/Math/MathML"> i i </math>i 个元素的最长不下降子序列的长度,循环的时候我们只需要维护好 <math xmlns="http://www.w3.org/1998/Math/MathML"> d d </math>d 这个数组还有 <math xmlns="http://www.w3.org/1998/Math/MathML"> l e n len </math>len 就可以了。关键在于如何维护。

考虑进来一个元素 <math xmlns="http://www.w3.org/1998/Math/MathML"> a i a_i </math>ai:

  1. 元素大于等于 <math xmlns="http://www.w3.org/1998/Math/MathML"> d l e n d_{len} </math>dlen,直接将该元素插入到 <math xmlns="http://www.w3.org/1998/Math/MathML"> d d </math>d 序列的末尾。
  2. 元素小于 <math xmlns="http://www.w3.org/1998/Math/MathML"> d l e n d_{len} </math>dlen,找到 第一个 大于它的元素,用 <math xmlns="http://www.w3.org/1998/Math/MathML"> a i a_i </math>ai 替换它。

为什么:

  • 对于步骤 1:

    由于我们是从前往后扫,所以说当元素大于等于 <math xmlns="http://www.w3.org/1998/Math/MathML"> d l e n d_{len} </math>dlen 时一定会有一个不下降子序列使得这个不下降子序列的末项后面可以再接这个元素。如果 <math xmlns="http://www.w3.org/1998/Math/MathML"> d d </math>d 不接这个元素,可以发现既不符合定义,又不是最优解。

  • 对于步骤 2:

    同步骤 1,如果插在 <math xmlns="http://www.w3.org/1998/Math/MathML"> d d </math>d 的末尾,那么由于前面的元素大于要插入的元素,所以不符合 <math xmlns="http://www.w3.org/1998/Math/MathML"> d d </math>d 的定义,因此必须先找到 第一个 大于它的元素,再用 <math xmlns="http://www.w3.org/1998/Math/MathML"> a i a_i </math>ai 替换。

步骤 2 如果采用暴力查找,则时间复杂度仍然是 <math xmlns="http://www.w3.org/1998/Math/MathML"> O ( n 2 ) O(n^2) </math>O(n2) 的。但是根据 <math xmlns="http://www.w3.org/1998/Math/MathML"> d d </math>d 数组的定义,又由于本题要求不下降子序列,所以 <math xmlns="http://www.w3.org/1998/Math/MathML"> d d </math>d 一定是 单调不减 的,因此可以用二分查找将时间复杂度降至 <math xmlns="http://www.w3.org/1998/Math/MathML"> O ( n log ⁡ n ) O(n\log n) </math>O(nlogn).

参考代码如下:

=== "C++" cpp for (int i = 0; i < n; ++i) scanf("%d", a + i); memset(dp, 0x1f, sizeof dp); mx = dp[0]; for (int i = 0; i < n; ++i) { *std::upper_bound(dp, dp + n, a[i]) = a[i]; } ans = 0; while (dp[ans] != mx) ++ans;

=== "Python" python dp = [0x1f1f1f1f] * MAXN mx = dp[0] for i in range(0, n): bisect.insort_left(dp, a[i], 0, len(dp)) ans = 0 while dp[ans] != mx: ans += 1

参考资料与注释

AI算法蒋同学致力于信息学奥赛教学、人工智能算法研究工作! B站淘宝

Footnotes

  1. 位运算求最长公共子序列 - -Wallace- - 博客园

  2. 最长不下降子序列 nlogn 算法详解 - lvmememe - 博客园

相关推荐
<但凡.11 分钟前
题海拾贝:力扣 138.随机链表的复制
数据结构·算法·leetcode
田梓燊42 分钟前
图论 八字码
c++·算法·图论
Tanecious.1 小时前
C语言--数据在内存中的存储
c语言·开发语言·算法
Bran_Liu2 小时前
【LeetCode 刷题】栈与队列-队列的应用
数据结构·python·算法·leetcode
kcarly2 小时前
知识图谱都有哪些常见算法
人工智能·算法·知识图谱
CM莫问3 小时前
<论文>用于大语言模型去偏的因果奖励机制
人工智能·深度学习·算法·语言模型·自然语言处理
程序猿零零漆3 小时前
《从入门到精通:蓝桥杯编程大赛知识点全攻略》(五)-数的三次方根、机器人跳跃问题、四平方和
java·算法·蓝桥杯
无限码力3 小时前
路灯照明问题
数据结构·算法·华为od·职场和发展·华为ode卷
嘻嘻哈哈樱桃3 小时前
前k个高频元素力扣--347
数据结构·算法·leetcode
dorabighead3 小时前
小哆啦解题记:加油站的奇幻冒险
数据结构·算法