最长公共子序列详解及代码实现

来源:互联网 发布:windows美化大师电脑 编辑:程序博客网 时间:2024/05/01 10:19

一、最长公共子序列

首先区别一下子串与子序列,子串要求是连续的而子序列不要求连续。例如ABCDEG字符串, ABC为子串,ADG为子序列。


设有两个字符串数组 str1【N】和str2【M】,构建二维数组DP【N】【M】,其中DP【i】【j】的含义:字符串str1【0……i】与str2【0……j】的公共子序列的长度。

我们来分析DP【i】【j】的来源,

1、首先DP【i】【j】的值不会小于DP【i-1】【j-1】,如果str1【i】==str2【j】,则DP【i】【j】 = DP【i-1】【j-1】+1。

2、如果str1【i】!=  str2【j】,DP的来源于max( DP【i】【j-1】,DP【i-1】【j】),

此时不用考虑DP【i-1】【j-1】因为:

DP【i】【j-1】>=DP【i-1】【j-1】,

DP【i-1】【j】>=DP【i-1】【j-1】

( 没看明白可以这样考虑:

str1【0……i】与str2【0……j-1】 的公共子序列肯定不会比str1【0……i-1】与str2【0……j-1】的公共子序列小,

str1【0……i-1】与str2【0……j】的公共子序列肯定不会比str1【0……i-1】与str2【0……j-1】的公共子序列小。)

所以选取这两个最大一个即可。


明白DP【i】【j】的含义,以及DP【i】【j】的推导后,我们再来看如何构造DP【N】【M】数组。

1、首先构造第一行,

DP【0】【0……M-1】代表字符串str1【0……0】与str2【0……M-1】的最长公共子序列,

可以看出这一行的值,不为1就为0,

且当DP【0】【K】为1时(含义:str1【0】 ==str2【K】&&str1【0】!=str2【0……K-1】)   DP【0】【K+1……M-1】均为1。

2、构造第一列,

DP【0……N-1】【0】代表str1【0……N-1】与str2【0……0】的最长公共子序列,

可以看出这一列的值同第一行一样,不为1就为0,

且当DP【K】【0】为1时(含义:str1【K】 ==str2【0】&&str1【0……K-1】!=str2【0】)   DP【K+1……M-1】【0】均为1。

3、知道了第一行和第一列的值,可以根据求得其他所有矩阵中的值。



构造DP【N】【M】之后,就可以根据DP【N】【M】来求得最长公共子序列。

1、首先从右下角开始,DP【N-1】【M-1】,如果str1【N-1】 == str2【M-1】 则说明str1【N-1】一定是最长公共子序列中的一个数,得记录下来

2、如果str1【N-1】 != str2【M-1】,则不用记录str1【N-1】或str2【M-1】,这时需要向上(DP【i-1】【j】)移动或者向左

(DP【i】【j-1】)移动,看这两个值哪个大,谁大往谁的方向移。(可以这样理解,既然我们这个点str1【N-1】与str2【M-1】不同,但是此时最大递增子序列的长度应该是不变的,所以应该向DP【】【】值不变的方向移动,回想起我们在创建DP【】【】数组时,当str1【N-1】 != str2【M-1】,DP【N-1】【M-1】的来源是左边和上边其中的较大值。所以应该向左边和上边中的较大值移动)

3、每到str1【K1】 == str2【K2】  记录下str1【k1】,不相等时,向左和上的较大值移动,直到DP【K1】【k2】==0终止。


如上图的例子:str1 = “xi A B C B D A B”   str2 = "yj B D C A B A"

代码:

// write your code here cpp#include<iostream>#include<string>#include<vector>using namespace std;int Max(int a,int b){return (a>b)?a:b;}void creatDp(string s1,string s2,int *dp){int len1 = s1.length();int len2 = s2.length();//int *dp = new int[len1*len2];//先求出第一行for(int j = 0;j<len2;j++){if(s1[0] == s2[j]){*(dp+0*len2+j) = 1;for(;j<len2;j++)*(dp+0*len2+j) = 1;break;}else        *(dp+0*len2+j) = 0;}//然后求第一列for(int i = 0;i<len1;i++){if(s1[i] == s2[0]){*(dp+i*len2+0) = 1;for(;i<len1;i++)*(dp+i*len2+0) = 1;break;}else*(dp+i*len2+0) = 0;}//求其他的数据for(int i =1;i<len1;i++){for(int j =1;j<len2;j++){if(s1[i] == s2[j])*(dp+i*len2+j) = *(dp+(i-1)*len2+(j-1))+1;else*(dp+i*len2+j) = Max(*(dp+(i-1)*len2+j),*(dp+i*len2+j-1));}}     //这个值记录着最大公共子序列的长度   //cout<<dp[len1*len2-1];}void getLCS(int *dp,string s1,string s2){int len1 = s1.length();int len2 = s2.length();int i = len1-1;int j = len2-1;int len = dp[i*len2+j];char *result = new char[len];int k =len-1;while(*(dp+i*len2+j)!=0&&i>=0&&j>=0){if(s1[i] == s2[j]){result[k--] = s1[i];i--;j--;}else{if(*(dp+(i-1)*len2+j) > *(dp+(i)*len2+j-1))i--;elsej--;}}for(int i = 0;i<len;i++)cout<<result[i]<<" ";cout<<endl;}int main(){string s1 ;string s2 ;    while(cin>>s1>>s2){        int len1 = s1.length();        int len2 = s2.length();        int *dp = new int[len1*len2];        creatDp(s1, s2,dp);        getLCS(dp,s1,s2);delete[] dp;    }return 0;}



测试:

abcfbc abfcabprogramming contestabcd mnp





应用:例如给你一个字符串,可以从中删除一些字符,使得剩下的串是一个回文串。如何删除才能使得回文串最长呢?

就是该字符串的大小和   该串与反串的最大公共子序列 的差值。





0 0