动态规划法(三)——最长公共子序列

来源:互联网 发布:英制螺丝孔算法 编辑:程序博客网 时间:2024/06/05 23:54

问题描述

给定两个序列,求出它们的最长公共子序列。
如:序列X={a,b,c,b,d,a,b},Y={b,d,c,a,b,a},则X和Y的最长公共子序列为{b,c,b,a}

  • 子序列:子序列为原序列的一个子集,并不要求连续,但要求子序列中元素的顺序和原序列元素的顺序一致。

定理

设两个序列分别是X={x1,x2……,xm},Y={y1,y2……,yn},它们的最长公共子序列为Z={z1,z2,……,zk}。

  1. 若xm=yn,则先求Xm-1和Yn-1的最长公共子序列,再在其尾部加上xm即可得Xm和Yn的最长公共子序列。
  2. 若xm!=yn,则必须分别求Xm、Yn-1和Xm-1、Yn的最长公共子序列,其中较长者就是Xm和Yn的最长公共子序列。

数据结构

  • c[i][j]:
    用来记录Xi和Yj的最长公共子序列的长度。

  • s[i][j]:
    用来标识Xi和Yi的最长公共子序列是由哪种情况得来:c[i][j-1]、c[i-1][j]、c[i][j]+1。
    该数组能还原出最长公共子序列。

算法思路

1. 生成c数组和s数组所有元素

  1. 将c数组的第0行、第0列初始化为0;
  2. 从c数组的第一行、第一列开始,依次从左向右、从上到下填充元素值:
    a)若x[i]==y[j],则c[i][j]=c[i-1][j-1]+1,s[i][j]=1;
    b)若x[i]!=y[j],则分别计算c[i][j-1]、c[i-1][j],将大的那个作为c[i][j];并且,如果c[i-1][j]>=c[i][j-1],则s[i][j]=2;如果c[i-1][j]< c[i][j-1],则s[i][j]=3;

2. 根据s数组求得最长公共子序列

代码实现

private int[][] c;private int[][] s;

1. 生成c数组和s数组所有元素

void LCSLength(String a, String b){    // x和y的最前端分别加上0    char[] x = ("0"+a).toCharArray();    char[] y = ("0"+b).toCharArray();    c = new int[x.length][y.length];    s = new int[x.length][y.length];    // 初始化c、s    for( int i=0; i<x.length; i++ ){        c[i][0] = 0;    }    for( int i=0; i<y.length; i++ ){        c[0][i] = 0;    }    // 从上到下、从左到右填充c、s数组    for( int i=1; i<x.length; i++ ){        for( int j=1; j<y.length; j++ ){            if( x[i]==y[j] ){                c[i][j] = c[i-1][j-1]+1;                s[i][j] = 1;            }            else if ( c[i-1][j] >= c[i][j-1] ){                c[i][j] = c[i-1][j];                s[i][j] = 2;            }            else {                c[i][j] = c[i][j-1];                s[i][j] = 3;            }        }    }}

2. 根据s数组求得最长公共子序列

StringBuilder sb = new StringBuilder();void CLCS( int i, int j ){    if ( i==0 || j==0 ) return;    if ( s[i][j]==1 ) {        CLCS( i-1,j-1 );        sb.append( x[i] ); // 为了让公共子序列正序输出,因此需要在递归调用之后将x[i]添加至sb    }    else if ( s[i][j]==2 ){        CLCS( i-1,j );    }    else {        CLCS( i,j-1 );    }}

图示

  • 初始化c和s数组,将第0行、第0列都设为0:
    title

  • 从第一行、第一列开始,依次从左到右、从上到下填充c和s数组:
    title

  • 当c和s都填充完毕后,就可以根据s数组找到最长公共子序列
    从s数组最右下角的元素开始:
    a)若s[i][j]==1,则找到一个字符,并继续比较左上角的元素;
    b)若s[i][j]==2,则继续比较上方的元素;
    c)s[i][j]==3,则继续比较左侧的元素。
    d)直到i==0或j==0为止。

4 2
原创粉丝点击