最长递增子序列 [No. 39]

来源:互联网 发布:公务员网络培训挂机 编辑:程序博客网 时间:2024/06/06 02:40

给定一个长度为n的数组,找出一个最长的单调递增子序列(不一定连续,当时先后顺序不能乱)。 更正式的定义是:

设L=<a1,a2,…,an>是n个不同的实数的序列,L的递增子序列是这样一个子序列Lin=<ak1,ak2,…,akm>,其中k1<k2<…<km且ak1<ak2<…<akm。求最大的m值

比如数组A 为{10, 11, 12, 13, 1, 2, 3, 15}, 那么最长递增子序列为{10,11,12,13,15}。

这道题用DP解,假设从第1位到第 j 位的最长的子序列长度为L(j),那么它一定是 L(j) =  max_{i < j and A[i] <= A[j]}  L(i) + 1. 然后我们遍历整个 L(j), 找出最大的长度的位置。整个操作的复杂度为 O(n^2).

代码如下:

public int LIS(int[] arr) {// array a is used to store the maximum lengthint[] a = new int[arr.length];// initialization, set all the elements in array a to 1;for (int i = 0; i < a.length; i++) {a[i] = 1;}for (int i = 1; i < arr.length; i++) {for (int j = 0; j < i; j++ ) {if (arr[i] > arr[j] && a[i] <= a[j] ) {a[i] = a[j] + 1;}}}int max = -1;//find the longest subsequencefor (int i = 0; i < a.length; i++) {if (a[i] > max ) max = a[i];}return max;}

扩展: 从一列数中筛除尽可能少的数使得从左往右看,这些数是从小到大再从大到小的。

假设是一个数组arr[n], 它的分段点是 i (0-i 递增, i 到 n-1 递减), 假设我们用方法LIS(i) 找到最长的从0到 i 的递增子序列,LDS(i) 找到从 i 到 n -1的最长递减子序列,那么它的总长度为 LIS(i) + LDS(i) -1, 所以我们扫描整个数组,即让 i 从0 到 n-1, 找出使 LIS(i) + LDS(i) -1 最大的即可。

后面部分讲解如何用二分查找解决LIS问题,下面部分为转载。

转自: http://www.felix021.com/blog/read.php?1587

假设存在一个序列d[1..9] = 2 1 5 3 6 4 8 9 7,可以看出来它的LIS长度为5。
下面一步一步试着找出它。
我们定义一个序列B,然后令 i = 1 to 9 逐个考察这个序列。
此外,我们用一个变量Len来记录现在最长算到多少了
首先,把d[1]有序地放到B里,令B[1] = 2,就是说当只有1一个数字2的时候,长度为1的LIS的最小末尾是2。这时Len=1
然后,把d[2]有序地放到B里,令B[1] = 1,就是说长度为1的LIS的最小末尾是1,d[1]=2已经没用了,很容易理解吧。这时Len=1
接着,d[3] = 5,d[3]>B[1],所以令B[1+1]=B[2]=d[3]=5,就是说长度为2的LIS的最小末尾是5,很容易理解吧。这时候B[1..2] = 1, 5,Len=2
再来,d[4] = 3,它正好加在1,5之间,放在1的位置显然不合适,因为1小于3,长度为1的LIS最小末尾应该是1,这样很容易推知,长度为2的LIS最小末尾是3,于是可以把5淘汰掉,这时候B[1..2] = 1, 3,Len = 2
继续,d[5] = 6,它在3后面,因为B[2] = 3, 而6在3后面,于是很容易可以推知B[3] = 6, 这时B[1..3] = 1, 3, 6,还是很容易理解吧? Len = 3 了噢。
第6个, d[6] = 4,你看它在3和6之间,于是我们就可以把6替换掉,得到B[3] = 4。B[1..3] = 1, 3, 4, Len继续等于3
第7个, d[7] = 8,它很大,比4大,嗯。于是B[4] = 8。Len变成4了
第8个, d[8] = 9,得到B[5] = 9,嗯。Len继续增大,到5了。
最后一个, d[9] = 7,它在B[3] = 4和B[4] = 8之间,所以我们知道,最新的B[4] =7,B[1..5] = 1, 3, 4, 7, 9,Len = 5。
于是我们知道了LIS的长度为5。
!!!!! 注意。这个1,3,4,7,9不是LIS,它只是存储的对应长度LIS的最小末尾。有了这个末尾,我们就可以一个一个地插入数据。虽然最后一个d[9] = 7更新进去对于这组数据没有什么意义,但是如果后面再出现两个数字 8 和 9,那么就可以把8更新到d[5], 9更新到d[6],得出LIS的长度为6。
然后应该发现一件事情了:在B中插入数据是有序的,而且是进行替换而不需要挪动——也就是说,我们可以使用二分查找,将每一个数字的插入时间优化到O(logN)~~~~~于是算法的时间复杂度就降低到了O(NlogN)~!
代码如下:

public static int lis(int[] array) {if (array == null || array.length == 0) return -1;int[] B = new int[array.length];B[0] = array[0];int pointer = 0, left = 0, right = 0, mid = 0;for (int i = 1; i < array.length; i++) {left = 0; right = pointer;while (left <= right) {mid = left + (right - left)/2; //二分查找array[i]的插入位置if (B[mid] < array[i]) {left = mid + 1;}else {right = mid - 1;}}B[left] = array[i]; //插入if (left > pointer) pointer = left; //d[i]比现有的所有数字都大,所以left 才会大于 pointer。}return pointer + 1;} 

PS. 从上面代码可以得到一个结论。如果在一个数组里面查找一个数,而这个数在数组里不存在,那么通过二分查找时,退出while循环的时候,如果那个数比数组里最大的还大,那么,left会是数组长度+1,而如果这个数的大小在数组范围内,但该值并不存在于数组,那么,最后left会停在第一个比那个值大的位置。


原创粉丝点击