最长公共子序列问题LCS

来源:互联网 发布:lamp一键安装包ubuntu 编辑:程序博客网 时间:2024/06/06 12:49

                            最长公共子序列问题LCS

问题描述:给定两个字符串s1s2...sn和t1t2...tn,求出这两个字符串最长的公共子序列长度,字符串s的所有字符按其在字符串中的顺序出现在另外一个字符串t中,但并不要求字符串s中的字符连续出现在字符串t中,例如:s="abcd",t="becd",则最长公共子序为"bcd",长度为3。

问题分析:

     Xi=﹤x1,⋯,xi﹥即X序列的前i个字符 (1≤i≤m)(前缀)

     Yj=﹤y1,⋯,yj﹥即Y序列的前j个字符 (1≤j≤n)(前缀)

     假定Z=﹤z1,⋯,zk﹥∈LCS(X , Y)。

xm=yn(最后一个字符相同),则不难用反证法证明:该字符必是X与Y的任一最长公共子序列Z(设长度为k)的最后一个字符,即有zk = xm = yn 且显然有Zk-1∈LCS(Xm-1 , Yn-1)即Z的前缀Zk-1是Xm-1与Yn-1的最长公共子序列。此时,问题化归成求Xm-1与Yn-1的LCS(LCS(X , Y)的长度等于LCS(Xm-1 , Yn-1)的长度加1)。

xm≠yn,则亦不难用反证法证明:要么Z∈LCS(Xm-1, Y),要么Z∈LCS(X , Yn-1)。由于zk≠xm与zk≠yn其中至少有一个必成立,若zk≠xm则有Z∈LCS(Xm-1 , Y),类似的,若zk≠yn 则有Z∈LCS(X , Yn-1)。此时,问题化归成求Xm-1与Y的LCS及X与Yn-1的LCS。LCS(X , Y)的长度为:max{LCS(Xm-1 , Y)的长度, LCS(X , Yn-1)的长度}。

由于上述当xm≠yn的情况中,求LCS(Xm-1 , Y)的长度与LCS(X , Yn-1)的长度,这两个问题不是相互独立的:两者都需要求LCS(Xm-1,Yn-1)的长度。另外两个序列的LCS中包含了两个序列的前缀的LCS,故问题具有最优子结构性质考虑用动态规划法。

也就是说,解决这个LCS问题,你要求三个方面的东西:1、LCS(Xm-1,Yn-1)+1;2、LCS(Xm-1,Y),LCS(X,Yn-1);3、max{LCS(Xm-1,Y),LCS(X,Yn-1)}

最长公共子序列的结构有如下表示:

设序列X=<x1, x2, …, xm>和Y=<y1, y2, …, yn>的一个最长公共子序列Z=<z1, z2, …, zk>,则:

  1. 若xm=yn,则zk=xm=yn且Zk-1是Xm-1和Yn-1的最长公共子序列;
  2. 若xm≠yn且zk≠xm ,则Z是Xm-1和Y的最长公共子序列;
  3. 若xm≠yn且zk≠yn ,则Z是X和Yn-1的最长公共子序列。

其中Xm-1=<x1, x2, …, xm-1>,Yn-1=<y1, y2, …, yn-1>,Zk-1=<z1, z2, …, zk-1>。

dp[i+1][j+1]=dp[i][j]+1 (xm=yn)

            =max(dp[i][j+1],dp[i+1][j]) (xm≠yn)

代码:

int n,m;//长度char s[MAX_N],t[MAX_M];int dp[MAX_N+1][MAX_M+1];//DP数组void solve(){    for(int i=0;i<n;i++)    {        for(int j=0;j<m;j++)        {            if(s[i]==t[j])                dp[i+1][j+1]=dp[i][j]+1;            else                 dp[i+1][j+1]=max(dp[i][j+1],dp[i+1][j]);        }    }    printf("%d\n",dp[n][m]);//dp[n][m]就是LCS长度}

0 0
原创粉丝点击