最长上升子序列(LIS)&最长公共子序列(LCS)

来源：互联网发布：一对多sql语句编辑：程序博客网时间：2024/06/17 09:23

最长公共上升子序列（LCIS）的O(n^2)算法见http://blog.csdn.net/prstaxy/article/details/8881837

问题

给定一个长度为N的数组，找出一个最长的单调自增子序列（不一定连续，但是顺序不能乱）。例如：给定一个长度为6的数组A{5， 6， 7， 1， 2， 8}，则其最长的单调递增子序列为{5，6，7，8}，长度为4.

解法1：最长公共子序列法

这个问题可以转换为最长公共子序列问题。如例子中的数组A{5，6， 7， 1， 2， 8}，则我们排序该数组得到数组A‘{1， 2， 5， 6， 7， 8}，然后找出数组A和A’的最长公共子序列即可。显然这里最长公共子序列为{5, 6, 7, 8}，也就是原数组A最长递增子序列。最长公共子序列算法在算法导论上有详细讲解，这里简略说下思想。

假定两个序列为X={x1, x2, ..., xm}和Y={y1, y2, ..., yn)，并设Z={z1, z2, ..., zk}为X和Y的任意一个LCS。

1）如果xm = yn，则zk = xm=yn，且Zk-1是Xm-1和Yn-1的一个LCS。

2）如果xm != yn, 则zk != xm蕴含Z是Xm-1和Y得一个LCS。

3）如果xm != yn, 则zk != yn蕴含Z是X和Yn-1的一个LCS。

AC POJ 2533
http://poj.org/problem?id=2533

#include<iostream>  #include<cstdio>#include<cstring>using namespace std; #define MAX 501char a[MAX],b[MAX];int dp[MAX][MAX];int lcs(int la,int lb){for(int i=1;i<=la;++i){for(int j=1;j<=lb;++j){if(a[i-1]==b[j-1])dp[i][j]=dp[i-1][j-1]+1;else{if(dp[i-1][j]>dp[i][j-1])dp[i][j]=dp[i-1][j];elsedp[i][j]=dp[i][j-1];}}}return dp[la][lb];} int main(){    int len1,len2,ans;      while(scanf("%s %s",a,b)!=EOF)      {    len1=strlen(a);    len2=strlen(b);   ans=lcs(len1,len2);printf("%d\n",ans);    }    return 0;  }

解法2：动态规划法（时间复杂度O(N^2))

设长度为N的数组为{a0，a1, a2, ...an-1)，则假定以aj结尾的数组序列的最长递增子序列长度为L(j)，则L(j)={ max(L(i))+1, i<j且a[i]<a[j] }。也就是说，我们需要遍历在j之前的所有位置i(从0到j-1)，找出满足条件a[i]<a[j]的L(i)，求出max(L(i))+1即为L(j)的值。最后，我们遍历所有的L(j)（从0到N-1），找出最大值即为最大递增子序列。时间复杂度为O(N^2)。

例如给定的数组为{5，6，7，1，2，8}，则L(0)=1, L(1)=2, L(2)=3, L(3)=1, L(4)=2, L(5)=4。所以该数组最长递增子序列长度为4，序列为{5，6，7，8}。算法代码如下：（以下代码和原文不同）

#include <iostream>#define N 30using namespace std;int L[N];//L[i]记录以a[i]结尾的最长的递增子序列长度int lis(int a[],int n)//a数组,包含n个元素 {    for(int i=0; i<n; i++)    {        int max=0;//初始为0        for(int j=0; j<i; j++)        {//查找L[0]到L[i-1]结尾数比a[i]小的最大是L[?]记录到max            if(a[i]>a[j] && L[j]>max)                max=L[j];        }        L[i]=max+1;//加上a[i]后就可以让序列长度增一    }    int ans=L[0];    for(int i=1;i<n;i++)//遍历L数组寻找最大数,因为L[n-1]未必是最大的     {    if(L[i]>ans)    ans=L[i];}    return ans;}int main(){//int a[]={5,6,7,1,2,8};      int a[]={1, 4, 5, 6, 2, 3, 8,1};      int n=8;      cout<<lis(a,n)<<endl;cout<<endl;      for(int i=0;i<n;++i)//输出L[i] 记录的数       {          cout<<L[i]<<endl;      }      return 0; }

解法3：O(NlgN）算法

假设存在一个序列d[1..9] ={ 2，1 ，5 ，3 ，6，4， 8 ，9， 7}，可以看出来它的LIS长度为5。
下面一步一步试着找出它。
我们定义一个序列B，然后令 i = 1 to 9 逐个考察这个序列。
此外，我们用一个变量Len来记录现在最长算到多少了

首先，把d[1]有序地放到B里，令B[1] = 2，就是说当只有1一个数字2的时候，长度为1的LIS的最小末尾是2。这时Len=1

然后，把d[2]有序地放到B里，令B[1] = 1，就是说长度为1的LIS的最小末尾是1，d[1]=2已经没用了，很容易理解吧。这时Len=1

接着，d[3] = 5，d[3]>B[1]，所以令B[1+1]=B[2]=d[3]=5，就是说长度为2的LIS的最小末尾是5，很容易理解吧。这时候B[1..2] = 1, 5，Len＝2

再来，d[4] = 3，它正好加在1,5之间，放在1的位置显然不合适，因为1小于3，长度为1的LIS最小末尾应该是1，这样很容易推知，长度为2的LIS最小末尾是3，于是可以把5淘汰掉，这时候B[1..2] = 1, 3，Len = 2

继续，d[5] = 6，它在3后面，因为B[2] = 3, 而6在3后面，于是很容易可以推知B[3] = 6, 这时B[1..3] = 1, 3, 6，还是很容易理解吧？ Len = 3 了噢。

第6个, d[6] = 4，你看它在3和6之间，于是我们就可以把6替换掉，得到B[3] = 4。B[1..3] = 1, 3, 4， Len继续等于3

第7个, d[7] = 8，它很大，比4大，嗯。于是B[4] = 8。Len变成4了

第8个, d[8] = 9，得到B[5] = 9，嗯。Len继续增大，到5了。

最后一个, d[9] = 7，它在B[3] = 4和B[4] = 8之间，所以我们知道，最新的B[4] =7，B[1..5] = 1, 3, 4, 7, 9，Len = 5。

于是我们知道了LIS的长度为5。

注意，这个1,3,4,7,9不是LIS，它只是存储的对应长度LIS的最小末尾。有了这个末尾，我们就可以一个一个地插入数据。虽然最后一个d[9] = 7更新进去对于这组数据没有什么意义，但是如果后面再出现两个数字 8 和 9，那么就可以把8更新到d[5], 9更新到d[6]，得出LIS的长度为6。

然后应该发现一件事情了：在B中插入数据是有序的，而且是进行替换而不需要挪动——也就是说，我们可以使用二分查找，将每一个数字的插入时间优化到O(logN)~~~~~于是算法的时间复杂度就降低到了O(NlogN)～！

代码如下（代码中的数组B从位置0开始存数据）：

#include <stdio.h>  #include <stdlib.h>  #include <string.h>    #define N 9 //数组元素个数  int array[N] = {2, 1, 6, 3, 5, 4, 8, 7, 9}; //原数组  int B[N]; //在动态规划中使用的数组,用于记录中间结果,其含义三言两语说不清,请参见博文的解释  int len; //用于标示B数组中的元素个数    int LIS(int *array, int n); //计算最长递增子序列的长度,计算B数组的元素,array[]循环完一遍后,B的长度len即为所求  int BiSearch(int *b, int len, int w); //做了修改的二分搜索算法    int main()  {      printf("LIS: %d\n", LIS(array, N));        int i;      for(i=0; i<len; ++i)      {          printf("B[%d]=%d\n", i, B[i]);      }        return 0;  }    int LIS(int *array, int n)  {      len = 1;      B[0] = array[0];      int i, pos = 0;        for(i=1; i<n; ++i)      {          if(array[i] > B[len-1]) //如果大于B中最大的元素，则直接插入到B数组末尾          {              B[len] = array[i];              ++len;          }          else          {              pos = BiSearch(B, len, array[i]); //二分查找需要插入的位置              B[pos] = array[i];          }      }        return len;  }    //修改的二分查找算法，返回数组元素需要插入的位置。  int BiSearch(int *b, int len, int w)  {      int left = 0, right = len - 1;      int mid;      while (left <= right)      {          mid = left + (right-left)/2;          if (b[mid] > w)              right = mid - 1;          else if (b[mid] < w)              left = mid + 1;          else    //找到了该元素，则直接返回              return mid;      }      return left;//数组b中不存在该元素，则返回该元素应该插入的位置  }

转自 http://blog.csdn.net/ssjhust123/article/details/7798737

最长上升子序列(LIS)&最长公共子序列(LCS)

最长公共上升子序列（LCIS）的O(n^2)算法 见http://blog.csdn.net/prstaxy/article/details/8881837

问题

解法1：最长公共子序列法

解法2：动态规划法（时间复杂度O(N^2))

解法3：O(NlgN）算法

最长公共上升子序列（LCIS）的O(n^2)算法见http://blog.csdn.net/prstaxy/article/details/8881837