最长单调递增子序列的三种解法

来源:互联网 发布:sha1算法 编辑:程序博客网 时间:2024/05/16 02:13


从报名蓝桥杯开始我就觉得我走入了一条及其坑的路。


从大一到大三我写过的代码,思考过的算法真是少之又少,一个动态规划我依旧没有吃透,真的是觉得好有挫败感。不过还好,一点点来。


既然知道自己要去做这件事情,就认真去做吧。就算开始的比较晚但是能学到东西就很好。


这是转载自爱天涯技术论坛。http://qiemengdao.iteye.com/blog/1660229


解释部分是人家的,代码是我自己又写了一遍的,加深理解吧算是。觉得自己学习能力真的是有待加强。


问题

给定一个长度为N的数组,找出一个最长的单调自增子序列(不一定连续,但是顺序不能乱)。例如:给定一个长度为6的数组A{5, 6, 7, 1, 2, 8},则其最长的单调递增子序列为{5,6,7,8},长度为4.

解法1:最长公共子序列法

这个问题可以转换为最长公共子序列问题。如例子中的数组A{5,6, 7, 1, 2, 8},则我们排序该数组得到数组A‘{1, 2, 5, 6, 7, 8},然后找出数组A和A’的最长公共子序列即可。显然这里最长公共子序列为{5, 6, 7, 8},也就是原数组A最长递增子序列。最长公共子序列算法在算法导论上有详细讲解,这里简略说下思想。

假定两个序列为X={x1, x2, ..., xm}和Y={y1, y2, ..., yn),并设Z={z1, z2, ..., zk}为X和Y的任意一个LCS。

1)如果xm = yn,则zk = xm=yn,且Zk-1是Xm-1和Yn-1的一个LCS。

2)如果xm != yn, 则zk != xm蕴含Z是Xm-1和Y得一个LCS。

3)如果xm != yn, 则zk != yn蕴含Z是X和Yn-1的一个LCS。


这个方法我记得原来老师讲过,但是都忘记怎么实现了。今天先放在这里,立个flag,后期补充上。

解法2:动态规划法(时间复杂度O(N^2))

设长度为N的数组为{a0,a1, a2, ...an-1),则假定以ai结尾的数组序列的最长递增子序列长度为L(i),则L(i)={ max(L(j))+1, j<i且a[j]<a[i] }。也就是说,我们需要遍历在i之前的所有位置j(从0到i-1),找出满足条件a[j]<a[i]的L(j),求出max(L(j))+1即为L(j)的值。最后,我们遍历所有的L(i)(从0到N-1),找出最大值即为最大递增子序列。时间复杂度为O(N^2)。

例如给定的数组为{5,6,7,1,2,8},则L(0)=1, L(1)=2, L(2)=3, L(3)=1, L(4)=2, L(5)=4。所以该数组最长递增子序列长度为4,序列为{5,6,7,8}。算法代码如下:

#include<iostream>
#include<algorithm>
#include<cstring>
using namespace std;
char array[10001];
int MaxLen[10001];
//最长单调递增子序列,解法一
void LIS (){
    memset(MaxLen,0,sizeof(MaxLen));   //将Maxlen数组初始化为0
    int len = strlen(array);  //求出字符串长度
    for(int i=0;i<len;i++){
        MaxLen[i]= 1;
        //通过两步判断实现对最长子序列的查找
        for(int j=0;j<i;j++){
            if(array[i]>array[j]&&MaxLen[i]<1+MaxLen[j]){

                    MaxLen[i]= 1+MaxLen[j];

            }
        }
    }
}
//Max存储以array[i]为末尾元素的LIS 的长度,所以max数组的最大值即array的lis长度
int main ()
{
    int N,i,len,Max;
    cin>>N;
    while(N--)
    {
        Max =0;
        cin>>array;
        LIS();
        //通过循环查找其最大值
        len = strlen(array);
        for(i=0;i<len;i++)
        {
            if(Max < MaxLen[i]){
                Max = MaxLen[i];
            }
        }
        cout<<Max<<endl;
    }
    return 0;
}



这个代码是一个让我比较容易理解的代码。他就是很严格的按照动态规划的要求,有状态和状态转移方程。

状态是L[i],它的下标和字符串的下标一样,代表的是若该字符是最长递增子序列的最后一个字符,那么序列的长度就是L[i]。

那么L[i]的数值如何确定呢?    则是由状态转移方程来进行这个完成工作的。

两个循环,下标 i 前面的字符是否小于这个字符,若小于且L[j]+1>L[i],则L[i] = L[j]+1;


但是这种方法有一个问题,不能输出该序列。因为没有存储。


解法3:O(NlgN)算法

假设存在一个序列d[1..9] ={ 2,1 ,5 ,3 ,6,4, 8 ,9, 7},可以看出来它的LIS长度为5。
下面一步一步试着找出它。
我们定义一个序列B,然后令 i = 1 to 9 逐个考察这个序列。
此外,我们用一个变量Len来记录现在最长算到多少了

首先,把d[1]有序地放到B里,令B[1] = 2,就是说当只有1一个数字2的时候,长度为1的LIS的最小末尾是2。这时Len=1

然后,把d[2]有序地放到B里,令B[1] = 1,就是说长度为1的LIS的最小末尾是1,d[1]=2已经没用了,很容易理解吧。这时Len=1

接着,d[3] = 5,d[3]>B[1],所以令B[1+1]=B[2]=d[3]=5,就是说长度为2的LIS的最小末尾是5,很容易理解吧。这时候B[1..2] = 1, 5,Len=2

再来,d[4] = 3,它正好加在1,5之间,放在1的位置显然不合适,因为1小于3,长度为1的LIS最小末尾应该是1,这样很容易推知,长度为2的LIS最小末尾是3,于是可以把5淘汰掉,这时候B[1..2] = 1, 3,Len = 2

继续,d[5] = 6,它在3后面,因为B[2] = 3, 而6在3后面,于是很容易可以推知B[3] = 6, 这时B[1..3] = 1, 3, 6,还是很容易理解吧? Len = 3 了噢。

第6个, d[6] = 4,你看它在3和6之间,于是我们就可以把6替换掉,得到B[3] = 4。B[1..3] = 1, 3, 4, Len继续等于3

第7个, d[7] = 8,它很大,比4大,嗯。于是B[4] = 8。Len变成4了

第8个, d[8] = 9,得到B[5] = 9,嗯。Len继续增大,到5了。

最后一个, d[9] = 7,它在B[3] = 4和B[4] = 8之间,所以我们知道,最新的B[4] =7,B[1..5] = 1, 3, 4, 7, 9,Len = 5。

于是我们知道了LIS的长度为5。

注意,这个1,3,4,7,9不是LIS,它只是存储的对应长度LIS的最小末尾。有了这个末尾,我们就可以一个一个地插入数据。虽然最后一个d[9] = 7更新进去对于这组数据没有什么意义,但是如果后面再出现两个数字 8 和 9,那么就可以把8更新到d[5], 9更新到d[6],得出LIS的长度为6。

然后应该发现一件事情了:在B中插入数据是有序的,而且是进行替换而不需要挪动——也就是说,我们可以使用二分查找,将每一个数字的插入时间优化到O(logN)~~~~~于是算法的时间复杂度就降低到了O(NlogN)~!

代码如下(代码中的数组B从位置0开始存数据):

#include<iostream>
#include<algorithm>
#include<cstring>
using namespace std;
char array[10001];
char b[10001];
//最长单调递增子序列
int BiSearch(int len,char w)
{
    int left =0,right = len-1;
    int mid;
    while(left<=right){
        mid = left +(right-left)/2;
        if(b[mid]>w)
        {
            right = mid -1;
        }
        else if(b[mid]<w)
        {
            left = mid +1;
        }
        else
            return mid;
    }
    return left;
}
int LIS (int n){
    int len =1;    //表示b数组的长度
    b[0]=array[0];
    int i,pos=0;
    for(i=1;i<n;++i){
        if(array[i]>b[len-1])
        {
            b[len]=array[i];
            ++len;
        }
        else
        {
            pos= BiSearch(len,array[i]);
            b[pos]= array[i];
        }
    }
    return len;
}

//Max存储以array[i]为末尾元素的LIS 的长度,所以max数组的最大值即array的lis长度
int main ()
{
    int N,i,len,Max;
    cin>>N;
    while(N--)
    {
        Max =0;
        cin>>array;
        len = strlen(array);
        Max=LIS(len);
        cout<<Max<<endl;
        //通过循环查找其最大值
        for(int i=0;i<Max;i++){
            cout<<b[i];
        }
        cout<<endl;
    }
    return 0;
}

我喜欢这个解法,这个解法觉得很清楚。

用len记录b数组的长度,而且b数组还是记录的序列的内容。

这真是极好的。




0 0
原创粉丝点击