Max Subsequence Sum 最大子序列和问题 O(NlogN)与O(N)算法的对比

来源:互联网 发布:淘宝购买电影资源 编辑:程序博客网 时间:2024/04/28 12:10

《数据结构与算法分析》里用Max Subsequence Sum作为例子,介绍了算法分析的基本方法。书上提出了4种解决Max Subsequence Sum问题的算法,算法效率各不相同:O(N^3)、O(N^2)、O(NlogN)以及O(N)。后面两种算法很讨巧,特别是O(N)算法。

O(NlogN)算法的思路:采用divide and conquer的方法,将序列平分为两部分,分别计算每部分的max subsequence sum,同时计算跨越两部分的max subsequence sum,取3个值中的最大值,则为整个序列的max subsequence sum。实现的时候,需要用到递归函数。

代码:

int mss_method3(int* arr, int start, int end){if(start == end)return (arr[start] > 0 ? arr[start] : 0);int mid = (start+end)/2;int max_left = mss_method3(arr, start, mid);int max_right = mss_method3(arr, mid+1, end);// mid subsequenceint max_left_border = 0;int tmp_sum = 0;for(int i = mid; i >= start; i--){tmp_sum += arr[i];if(tmp_sum > max_left_border)max_left_border = tmp_sum;}int max_right_border = 0;tmp_sum = 0;for(int i = mid + 1; i <= end; i++){tmp_sum += arr[i];if(tmp_sum > max_right_border)max_right_border = tmp_sum;}int max_mid = max_left_border + max_right_border;// max subsequenceint iResult = max_left;if(max_right > iResult)iResult = max_right;if(max_mid > iResult)iResult = max_mid;return iResult;}

O(N)算法的思路:从头到尾依次遍历序列中的元素,在当前非负子序列上累加当前元素值,得到的结果记作tmp_sum。比较tm_sum和当前最大值,如果tmp_sum更大,则将它设置成当前最大值。判断tmp_sum是否小于0,若是,则表明当前子序列已经变成了负子序列,对随后的子序列和不再有“积极的贡献”了,所以将tmp_sum重置为0。

代码:

int mss_method4(int* arr, int size){int iResult = 0, tmp_sum = 0;for(int i = 0; i < size; i++){tmp_sum += arr[i];if(tmp_sum > iResult)iResult = tmp_sum;else if(tmp_sum <= 0)tmp_sum = 0;}return iResult;}

编写一个测试用例,观察两种算法的不同性能表现:

// max subsequence sum// 2012-12-06 by btwsmile#include <stdio.h>#include <stdlib.h>#include <Windows.h>int mss_method3(int*, int, int);int mss_method4(int*, int);int main(){int n = 10000000;int* iarray = new int[n];srand(GetTickCount());for(int i = 0; i < n; i++)iarray[i] = rand()%50 - 25;// adopt 3rd algorithmUINT uTimeCost = GetTickCount();int iResult = mss_method3(iarray, 0, n-1);uTimeCost = GetTickCount() - uTimeCost;printf("max subsequence sum is %d, time cost %d\n", iResult, uTimeCost);// adopt 4th algorithmuTimeCost = GetTickCount();iResult = mss_method4(iarray, n);uTimeCost = GetTickCount() - uTimeCost;printf("max subsequence sum is %d, time cost %d\n", iResult, uTimeCost);delete iarray;return 0;}

某一次运行的结果:

max subsequence sum is 1740, time cost 421max subsequence sum is 1740, time cost 16请按任意键继续. . .

O(N)算法比O(NlogN)算法性能提高了26.32倍,而N为1千万时,logN约等于23.25。考虑到算法分析的粗粒度,这样的运行结果与算法分析的结果基本吻合。