- 最长公共子序列
问题描述:
给定两个字符串 text1
和 text2
,返回这两个字符串的最长 公共子序列 的长度。如果不存在公共子序列 ,返回 0
。
一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串
。
例如,"ace"
是"abcde"
的子序列,但 "aec"
不是"abcde"
的子序列。
两个字符串的 公共子序列 是这两个字符串所共同拥有的子序列。
示例 1:
输入:text1 = "abcde", text2 = "ace"
输出:3
解释:最长公共子序列是 "ace" ,它的长度为 3 。
示例 2:
输入:text1 = "abc", text2 = "abc"
输出:3
解释:最长公共子序列是 "abc" ,它的长度为 3 。
提示:
1 <= text1.length, text2.length <= 1000
text1 和 text2 仅由小写英文字符组成。
问题分析:
常见的题目了,只是这个题目的子序列并不是严格的子序列
是相对位置一样也算
,很显然是dp
,设假设dp[i][j]
表示字符串text1[0:i]
和字符串text2[0:j]
的最长公共子序列的长度,现在讨论细节:
(1) 很显然当i=0 or j=0
时,dp
为0
。
(2) text1[0:i] == text2[0:j]
时,很显然就上一个状态加上1
,即:dp[i][j]=dp[i-1][j-1]+1
(3) text1[0:i] != text2[0:j]
时,竟然不相等,那就text1
和text2
各自的上一个状态
,两者取最值
就好了,即:dp[i][j]=max(dp[i-1][j], dp[i][j-1])
,所以整体状态转移方差为:
python
i=0 or j=0 : dp[i][j] = 0
text1[i-1] == text2[j-1]: dp[i][j] = dp[i-1][j-1] + 1
text1[i-1] != text2[j-1]: dp[i][j] = max(dp[i-1][j], dp[i][j-1])
Python3实现:
python
# @Time :2023/09/01
# @Author :Liu
# 动态规划
class Solution:
def longestCommonSubsequence(self, text1: str, text2: str) -> int:
m, n = len(text1), len(text2)
dp = [[0] * (n + 1) for _ in range(m + 1)]
for i in range(1, m + 1):
for j in range(1, n + 1):
if text1[i-1] == text2[j-1]:
dp[i][j] = dp[i-1][j-1] + 1
else:
dp[i][j] = max(dp[i-1][j], dp[i][j-1])
return dp[m][n]
举一反三:
其实面试的时候大多数情况下,会有所改动,例如,如果题目中的最长公共子串
必须为严格连续
的那?该如何求解?其实这个题目就是 LeetCode: 718. 最长重复子数组
这个时候其实可以转换成公共前缀
或者公共后缀
的问题,设假设dp[i][j]
表示字符串text1[0:i]
和字符串text2[0:j]
的最长公共后缀串
的长度,现在讨论细节:
(1) 很显然当i=0 or j=0
时,dp
为0
。
(2) text1[0:i] == text2[0:j]
时,很显然就上一个状态加上1
,即:dp[i][j]=dp[i-1][j-1]+1
(3) text1[0:i] != text2[0:j]
时,不相等,那就当前字符串text1[0:i]
和text2[0:j]
没有公共后缀串
,所以就是0
了,即:dp[i][j]=0
,所以整体状态转移方差为:
python
i=0 or j=0 : dp[i][j] = 0
text1[i-1] == text2[j-1]: dp[i][j] = dp[i-1][j-1] + 1
text1[i-1] != text2[j-1]: dp[i][j] = 0
Python3实现:
python
# @Time :2023/09/01
# @Author :Liu
# 动态规划
class Solution:
def longestCommonSubsequence2(self, text1, text2):
m, n = len(text1), len(text2)
dp = [[0] * (n + 1) for _ in range(m + 1)]
ans, sub = 0, '' # 最长公共子串长度,最长公共子串
for i in range(1, m + 1):
for j in range(1, n + 1):
if text1[i-1] == text2[j-1]:
dp[i][j] = dp[i-1][j-1] + 1
else:
dp[i][j] = 0 # 这一步其实没必要,本身就为0
if ans < dp[i][j]: # 更新最长子串
ans = dp[i][j]
sub = text1[i-ans: i]
return ans, sub
if __name__ == '__main__':
solu = Solution()
text1, text2 = "abcde", "eahabcd"
print(solu.longestCommonSubsequence2(text1, text2)) # (4, 'abcd')