1143. 最长公共子序列(LCS)
1143. 最长公共子序列(LCS)
最长公共子序列(Longest Common Subsequence,简称 LCS)是一道非常经典的面试题目,因为它的解法是典型的二维动态规划,大部分比较困难的字符串问题都和这个问题一个套路,比如说编辑距离。而且,这个算法稍加改造就可以用于解决其他问题,所以说LCS算法是值得掌握的。
所谓子序列,就是要保留原始顺序,但可以是不连续的。审题之后你可能会有疑问,这个问题为啥就是动态规划来解决呢?因为子序列类型的问题,穷举出所有可能的结果都不容易,而动态规划算法做的就是穷举 + 剪枝,它俩天生一对儿。所以可以说只要涉及子序列问题,十有八九都需要动态规划来解决。
动态规划思路
第一步,一定要明确 dp
数组的含义。
对于两个字符串的动态规划问题,套路是通用的。
比如说对于字符串 s1
和 s2
,它们的长度分别是 m、n
,一般来说都要构造一个这样的 DP table
:int[][] dp = new int[m+1][n+1]
。
这里为什么要加1,原因是你可以不加1,但是不加1你就会用其它限制条件来确保这个index是有效的,而当你加1之后你就不需要去判断只是让索引为0的行和列表示空串。
第二步,定义 base case
我们专门让索引为0的行和列表示空串,dp[0][...]
和 dp[...][0]
都应该初始化为0,这就是base case。
第三部,找状态转移方程
这是动态规划最难的一步,我们来通过案例推导出来。
对于 text1:abcde
和 text2:ace
两个字符串,我们定义两个指针进行遍历 i
和 j
。
遍历 text1 长度为 m
,定义指针 i
,从 0~m
。固定 i
指针(i == 1)位置,接下来开始遍历 text2 长度为 n
,定义指针 j
,从 0~n
。
-
第一次遍历 i = 1, j = 1
,两个a
相同所以dp[1][1] = 1
-
第二次遍历 i = 1, j = 2
,a与c不等,也不能是0,这里需转换成 a 与 ac 最长子序列,这里需要把之前的关系传递过来,所以dp[1][2] = 1
-
第三次遍历 i = 1, j = 3
,a与e不相同,把之前的关系传递过来,所以dp[1][3] = 1
text2:ace
已经走完来第一轮,接下来text1:abcde
走到来b
字符。
-
第四次遍历 i = 2, j = 1
,就是需要比较ab与a的最长子串,把之前的关系传递过来,所以dp[2][1] = 1
依次类推...(详看上图)
我们会发现遍历两个串字符,当不同时需要考虑两层遍历前面的值(关系传递),也就是左边和上边的其中较大的值,当想相同时,需要考虑各自不包含当前字符串的子序列长度,再加上1。
因此可以得出:现在对比的这两个字符不相同的,那么我们要取它的「要么是text1往前退一格,要么是text2往前退一格,两个的最大值」dp[i + 1][j + 1] = Math.max(dp[i+1][j], dp[i][j+1]);
对比的两个字符相同,去找它们前面各退一格的值加1即可:dp[i+1][j+1] = dp[i][j] + 1;
参考代码
// java
class Solution {
public int longestCommonSubsequence(String text1, String text2) {
int m = text1.length(), n = text2.length();
int[][] dp = new int[m + 1][n + 1];
for (int i = 0; i < m; i++) {
for (int j = 0; j < n; j++) {
// 获取两个串字符
char c1 = text1.charAt(i), c2 = text2.charAt(j);
if (c1 == c2) {
// 去找它们前面各退一格的值加1即可
dp[i + 1][j + 1] = dp[i][j] + 1;
} else {
//要么是text1往前退一格,要么是text2往前退一格,两个的最大值
dp[i + 1][j + 1] = Math.max(dp[i + 1][j], dp[i][j + 1]);
}
}
}
return dp[m][n];
}
}
部分图片来源于网络,版权归原作者,侵删。
👇点击阅读原文,查看往期内容!
快留言👇和我互动吧~