最长公共子序列(LCS)

来源:互联网 发布:淘宝汽车用品店排名 编辑:程序博客网 时间:2024/05/17 06:58
首先要明确的是子序列的概念,注意啦,子序列不等于子串。子序列是一个字符串S去掉零个或者多个字符后所剩下的字符串就叫做子序列。
  最长公共子序列的意思就是寻找两个给定字符串的的子序列,该子序列在两个字符串中以相同的次序出现,但是不一定是连续的。(连续的那是子串)
   例如序列X=ABCBDAB,Y=BDCABA。序列BCA是X和Y的一个公共子序列,但是不是X和Y的最长公共子序列,子序列BCBA是X和Y的一个LCS,序列BDAB也是。
   最简单想到的寻找LCS的一种方法是枚举X所有的子序列,然后逐一检查是否是Y的子序列,并随时记录发现的最长子序列。假设X有m个元素,则X有2^m个子序列,指数级的时间,对长序列不实际。
   其实最长公共子序列是动态规划(DP)的典型例子。

设X=1,x2,…,xm>和Y=1,y2,…,yn>为两个字符串,LCS(X,Y)表示X和Y的一个最长公共子序列,可以看出

  1. 如果xm=yn,则LCS ( X,Y ) =xm + LCS( Xm-1,Yn-1 )。
  2. 如果xm!=yn,则LCS( X,Y )= max{ LCS( Xm-1, Y ),LCS ( X, Yn-1 )}

LCS问题也具有重叠子问题性质:为找出X和Y的一个LCS,可能需要找X和Yn-1的一个LCS以及Xm-1和Y的一个LCS。但这两个子问题都包含着找Xm-1和Yn-1的一个LCS,等等.

 

DP最终处理的还是数值(极值做最优解),找到了最优值,就找到了最优方案;为了找到最长的LCS,我们定义dp[i][j]记录序列LCS的长度,合法状态的初始值为当序列X的长度为0或Y的长度为0,公共子序列LCS长度为0,即dp[i][j]=0,所以用i和j分别表示序列X的长度和序列Y的长度,状态转移方程为

  1. dp[i][j] = 0  如果i=0或j=0
  2. dp[i][j] = dp[i-1][j-1] + 1 如果X[i-1] = Y[i-1] (X[i-1]就是X数组中的第i个)
  3. dp[i][j] = max{ dp[i-1][j], dp[i][j-1]}  如果X[i-1] != Y[i-1]
#include <iostream>using namespace std; /* LCS * 设序列长度都不超过20*/ int dp[21][21]; /* 存储LCS长度, 下标i,j表示序列X,Y长度 */char X[21];char Y[21];int i, j; void main(){    cin.getline(X,20);    cin.getline(Y,20);     int xlen = strlen(X);    int ylen = strlen(Y);     /* dp[0-xlen][0] & dp[0][0-ylen] 都已初始化0 */    for(i = 1; i <= xlen; ++i)    {        for(j = 1; j <= ylen; ++j)        {            if(X[i-1] == Y[j-1])            {                dp[i][j] = dp[i-1][j-1] + 1;            }else if(dp[i][j-1] > dp[i-1][j])            {                dp[i][j] = dp[i][j-1];            }else            {                dp[i][j] = dp[i-1][j];            }        }    }    printf("len of LCS is: %d\n", dp[xlen][ylen]);     /* 输出LCS 本来是逆序打印的,可以写一递归函数完成正序打印       这里采用的方法是将Y作为临时存储LCS的数组,最后输出Y    */       i = xlen;    j = ylen;    int k = dp[i][j];    char lcs[21] = {'\0'};    while(i && j)    {        if(X[i-1] == Y[j-1] && dp[i][j] == dp[i-1][j-1] + 1)        {            lcs[--k] = X[i-1];            --i; --j;        }else if(X[i-1] != Y[j-1] && dp[i-1][j] > dp[i][j-1])        {            --i;        }else        {            --j;        }    }    printf("%s\n",lcs);}

例题:UVa 111
转自:http://blog.163.com/zhaohai_1988/blog/static/2095100852012792947765/
0 0
原创粉丝点击