最长公共子序列(Longest Common Subsequence, LCS)

最长公共子序列(Longest Common Subsequence, LCS)问题是计算机科学中的经典问题,用于寻找两个或多个序列(通常是字符串)中最长的相同子序列,但子序列中的元素不一定在原序列中保持原有的连续性。简单来说,就是找出一个子序列,它既存在于序列A中,又存在于序列B中,且长度最长。LCS问题在文本编辑、生物信息学等领域有广泛应用。

基本概念

  • 子序列:一个序列可以通过删除原序列中某些元素(也可以不删除)得到,但不能改变元素之间的相对顺序。例如,对于序列 "ABCDEF",其子序列包括 "A", "AB", "ABC", "AD", "B", "BC", "C", ..., "DEF", "F" 等。

最长公共子序列(LCS):给定两个序列 X=x1​,x2​,...,xm​ 和Y=y1​,y2​,...,yn​,它们的最长公共子序列 Z=z1​,z2​,...,zk​ 是满足以下条件的最长子序列:

  1. Z 是 X 的子序列。
  2. Z 是 Y 的子序列。

动态规划解法: LCS问题可以使用动态规划方法有效解决。定义一个二维数组 Lij 表示序列X1..i 和序列Y1..j 的最长公共子序列的长度。状态转移方程如下:

L\[i\]\[j\] = \\begin{cases} L\[i-1\]\[j-1\] + 1, \& \\text{如果 } x_i = y_j \\ \\max(L\[i-1\]\[j\], L\[i\]\[j-1\]), \& \\text{如果 } x_i \\neq y_j \\end{cases}

解释:当 xi​ 与 yj​ 相等时,最长公共子序列可以通过在前一个状态 Li−1j−1 的基础上增加一个字符得到;否则,最长公共子序列可能来自 X1..i−1 与 Y1..j 的最长公共子序列,也可能来自 X1..i 与 Y1..j−1 的最长公共子序列,取两者中的较大值。

初始化状态:0=0L0j=Li0=0,表示一个空序列与任何序列的最长公共子序列长度为0。

最终答案即 Lmn,表示整个序列 X 和序列 Y 的最长公共子序列的长度。

如果需要找出具体的最长公共子序列,可以使用一个额外的二维数组 Pij 存储决策信息,记录 Lij 是通过哪个状态转移得到的。回溯 P 数组即可重构最长公共子序列。

以下是使用动态规划解决最长公共子序列问题的Python示例:

复制代码
 

Python

复制代码
1def longest_common_subsequence(X, Y):
2    m, n = len(X), len(Y)
3    L = [[0] * (n + 1) for _ in range(m + 1)]
4
5    for i in range(1, m + 1):
6        for j in range(1, n + 1):
7            if X[i - 1] == Y[j - 1]:
8                L[i][j] = L[i - 1][j - 1] + 1
9            else:
10                L[i][j] = max(L[i - 1][j], L[i][j - 1])
11
12    return L[m][n]
13
14# 示例
15X = "ABCBDAB"
16Y = "BDCAB"
17
18lcs_length = longest_common_subsequence(X, Y)
19print("最长公共子序列长度:", lcs_length)

定义了一个名为longest_common_subsequence的函数,它接受两个字符串 XY 作为参数,返回它们的最长公共子序列的长度。在代码中,动态规划表 L 的大小为 (m+1) x (n+1),其中 mn 分别是字符串 XY 的长度。通过双重循环计算出每一项 L[i][j] 的值,最后返回 L[m][n] 即为所求的最长公共子序列长度。

相关推荐
2401_885665198 分钟前
基于OpenCV的模板匹配OCR实战:银行卡与身份证数字识别完整教程
人工智能·python·opencv·计算机视觉·ocr
装不满的克莱因瓶8 分钟前
了解3D卷积原理——从空间感知到时空建模的深度学习核心算子
人工智能·pytorch·python·深度学习·机器学习·3d·ai
仍然.18 分钟前
算法题目---BFS解决最短路问题
算法·宽度优先
渡众机器人20 分钟前
第八届全球校园人工智能算法精英大赛-算法应用赛-空地协同侦排挑战赛规则
人工智能·算法
wayz1131 分钟前
Overlap:HWMA(Holt-Winter移动平均线)技术指标详解
算法·金融·数据分析·量化交易·特征工程
cup1138 分钟前
[开源] Memory Checker:极致轻量的 Windows 托盘内存监测工具,告别内存焦虑
python·内存·工具·任务管理器·托盘
码云骑士39 分钟前
23-Django-ORM的N+1问题-select_related与prefetch_related详解
后端·python·django
Shadow(⊙o⊙)1 小时前
专题四:前缀和
数据结构·算法
Tbisnic1 小时前
AI大模型学习第十四天:Coze项目实战中的分治智慧
人工智能·python·学习·大模型·工作流·智能体·coze
master3361 小时前
python 安装pip
开发语言·python·pip