求连续子数组的最大和
来源:互联网 发布:键盘记录软件哪个好 编辑:程序博客网 时间:2024/05/17 00:04
原文地址 :http://blog.csdn.net/v_JULY_v/article/details/6444021
第一节、求子数组的最大和
3.求子数组的最大和
题目描述:
输入一个整形数组,数组里有正数也有负数。
数组中连续的一个或多个整数组成一个子数组,每个子数组都有一个和。
求所有子数组的和的最大值。要求时间复杂度为O(n)。
例如输入的数组为1, -2, 3, 10, -4, 7, 2, -5,和最大的子数组为3, 10, -4, 7, 2,
因此输出为该子数组的和18。
分析:这个问题在各大公司面试中出现频率之频繁,被人引用次数之多,非一般面试题可与之匹敌。单凭这点,就没有理由不入选狂想曲系列中了。此题曾作为本人之前整理的微软100题中的第3题,至今反响也很大。ok,下面,咱们来一步一步分析这个题:
1、求一个数组的最大子数组和,如此序列1, -2, 3, 10, -4, 7, 2, -5,我想最最直观也是最野蛮的办法便是,三个for循环三层遍历,求出数组中每一个子数组的和,最终求出这些子数组的最大的一个值。
记Sum[i, …, j]为数组A中第i个元素到第j个元素的和(其中0 <= i <= j < n),遍历所有可能的Sum[i, …, j],那么时间复杂度为O(N^3):
//本段代码引自编程之美
int MaxSum(int* A, int n)
{
int maximum = -INF;
int sum=0;
for(int i = 0; i < n; i++)
{
for(int j = i; j < n; j++)
{
for(int k = i; k <= j; k++)
{
sum += A[k];
}
if(sum > maximum)
maximum = sum;sum=0; //这里要记得清零,否则的话sum最终存放的是所有子数组的和。也就是编程之美上所说的bug。多谢苍狼。
}
}
return maximum;
}
2、其实这个问题,在我之前上传的微软100题,答案V0.2版[第1-20题答案],便直接给出了以下O(N)的算法:
- //copyright@ July 2010/10/18
- //updated,2011.05.25.
- #include <iostream.h>
- int maxSum(int* a, int n)
- {
- int sum=0;
- //其实要处理全是负数的情况,很简单,如稍后下面第3点所见,直接把这句改成:"int sum=a[0]"即可
- //也可以不改,当全是负数的情况,直接返回0,也不见得不行。
- int b=0;
- for(int i=0; i<n; i++)
- {
- if(b<0) //...
- b=a[i];
- else
- b+=a[i];
- if(sum<b)
- sum=b;
- }
- return sum;
- }
- int main()
- {
- int a[10]={1, -2, 3, 10, -4, 7, 2, -5};
- //int a[]={-1,-2,-3,-4}; //测试全是负数的用例
- cout<<maxSum(a,8)<<endl;
- return 0;
- }
- /*-------------------------------------
- 解释下:
- 例如输入的数组为1, -2, 3, 10, -4, 7, 2, -5,
- 那么最大的子数组为3, 10, -4, 7, 2,
- 因此输出为该子数组的和18。
- 所有的东西都在以下俩行,
- 即:
- b : 0 1 -1 3 13 9 16 18 13
- sum: 0 1 1 3 13 13 16 18 18
- 其实算法很简单,当前面的几个数,加起来后,b<0后,
- 把b重新赋值,置为下一个元素,b=a[i]。
- 当b>sum,则更新sum=b;
- 若b<sum,则sum保持原值,不更新。。July、10/31。
- ----------------------------------*/
3、不少朋友看到上面的答案之后,认为上述思路2的代码,没有处理全是负数的情况,当全是负数的情况时,我们可以让程序返回0,也可以让其返回最大的那个负数,下面便是前几日重写的,修改后的处理全是负数情况(返回最大的负数)的代码:
- //copyright@ July
- //July、updated,2011.05.25。
- #include <iostream.h>
- #define n 4 //多定义了一个变量
- int maxsum(int a[n])
- //于此处,你能看到上述思路2代码(指针)的优势
- {
- int max=a[0]; //全负情况,返回最大数
- int sum=0;
- for(int j=0;j<n;j++)
- {
- if(sum>=0) //如果加上某个元素,sum>=0的话,就加
- sum+=a[j];
- else
- sum=a[j]; //如果加上某个元素,sum<0了,就不加
- if(sum>max)
- max=sum;
- }
- return max;
- }
- int main()
- {
- int a[]={-1,-2,-3,-4};
- cout<<maxsum(a)<<endl;
- return 0;
- }
4、DP解法的具体方程:@ flyinghearts:设sum[i] 为前i个元素中,包含第i个元素且和最大的连续子数组,result 为已找到的子数组中和最大的。对第i+1个元素有两种选择:做为新子数组的第一个元素、放入前面找到的子数组。
sum[i+1] = max(a[i+1], sum[i] + a[i+1])
result = max(result, sum[i])
扩展:
1、如果数组是二维数组,同样要你求最大子数组的和列?
2、如果是要你求子数组的最大乘积列?
3、如果同时要求输出子段的开始和结束列?
第二节、Data structures and Algorithm analysis in C
下面给出《Data structures and Algorithm analysis in C》中4种实现。
- //感谢网友firo
- //July、2010.06.05。
- //Algorithm 1:时间效率为O(n*n*n)
- int MaxSubsequenceSum1(const int A[],int N)
- {
- int ThisSum=0 ,MaxSum=0,i,j,k;
- for(i=0;i<N;i++)
- for(j=i;j<N;j++)
- {
- ThisSum=0;
- for(k=i;k<j;k++)
- ThisSum+=A[k];
- if(ThisSum>MaxSum)
- MaxSum=ThisSum;
- }
- return MaxSum;
- }
- //Algorithm 2:时间效率为O(n*n)
- int MaxSubsequenceSum2(const int A[],int N)
- {
- int ThisSum=0,MaxSum=0,i,j,k;
- for(i=0;i<N;i++)
- {
- ThisSum=0;
- for(j=i;j<N;j++)
- {
- ThisSum+=A[j];
- if(ThisSum>MaxSum)
- MaxSum=ThisSum;
- }
- }
- return MaxSum;
- }
- //Algorithm 3:时间效率为O(n*log n)
- //算法3的主要思想:采用二分策略,将序列分成左右两份。
- //那么最长子序列有三种可能出现的情况,即
- //【1】只出现在左部分.
- //【2】只出现在右部分。
- //【3】出现在中间,同时涉及到左右两部分。
- //分情况讨论之。
- static int MaxSubSum(const int A[],int Left,int Right)
- {
- int MaxLeftSum,MaxRightSum; //左、右部分最大连续子序列值。对应情况【1】、【2】
- int MaxLeftBorderSum,MaxRightBorderSum; //从中间分别到左右两侧的最大连续子序列值,对应case【3】。
- int LeftBorderSum,RightBorderSum;
- int Center,i;
- if(Left == Right)Base Case
- if(A[Left]>0)
- return A[Left];
- else
- return 0;
- Center=(Left+Right)/2;
- MaxLeftSum=MaxSubSum(A,Left,Center);
- MaxRightSum=MaxSubSum(A,Center+1,Right);
- MaxLeftBorderSum=0;
- LeftBorderSum=0;
- for(i=Center;i>=Left;i--)
- {
- LeftBorderSum+=A[i];
- if(LeftBorderSum>MaxLeftBorderSum)
- MaxLeftBorderSum=LeftBorderSum;
- }
- MaxRightBorderSum=0;
- RightBorderSum=0;
- for(i=Center+1;i<=Right;i++)
- {
- RightBorderSum+=A[i];
- if(RightBorderSum>MaxRightBorderSum)
- MaxRightBorderSum=RightBorderSum;
- }
- int max1=MaxLeftSum>MaxRightSum?MaxLeftSum:MaxRightSum;
- int max2=MaxLeftBorderSum+MaxRightBorderSum;
- return max1>max2?max1:max2;
- }
- //Algorithm 4:时间效率为O(n)
- //同上述第一节中的思路3、和4。
- int MaxSubsequenceSum(const int A[],int N)
- {
- int ThisSum,MaxSum,j;
- ThisSum=MaxSum=0;
- for(j=0;j<N;j++)
- {
- ThisSum+=A[j];
- if(ThisSum>MaxSum)
- MaxSum=ThisSum;
- else if(ThisSum<0)
- ThisSum=0;
- }
- return MaxSum;
- }
返回最大子数组始末位置
这个问题是《编程之美》2.14的扩展问题,返回始末位置还是比较容易的,我们知道,每当当前子数组和的小于0时,便是新一轮子数组的开始,每当更新最大和时,便对应可能的结束下标,这个时候,只要顺便用本轮的起始和结束位置更新始末位置就可以,程序结束,最大子数组和以及其始末位置便一起被记录下来了,代码如下:
/* 最大子数组 返回起始位置 */
void Maxsum_location(int * arr, int size, int & start, int & end)
{
int maxSum = -INF;
int sum = 0;
int curstart = start = 0; /* curstart记录每次当前起始位置 */
for(int i = 0; i < size; ++i)
{
if(sum < 0)
{
sum = arr[i];
curstart = i; /* 记录当前的起始位置 */
}else
{
sum += arr[i];
}
if(sum > maxSum)
{
maxSum = sum;
start = curstart; /* 记录并更新最大子数组起始位置 */
end = i;
}
}
}
==================================
数组首尾相连【《编程之美》解法错误分析】
这个也是2.14的扩展问题,如果数组arr[0],…,arr[n-1]首尾相邻,也就是允许找到一段数字arr[i],…,arr[n-1],arr[0],…,a[j],使其和最大,该如何?
编程之美解法:这个问题的解可以分为两种情况:
1) 解没有跨越arr[n-1]到arr[0] (原问题)
2) 解跨越arr[n-1]到arr[0]
对于第二种情况,只要找到从arr[0]开始和最大的一段(arr[0],…,arr[j])以及以arr[n-1]结尾的和最大的一段(arr[i],…,arr[n-1])【Error 1】,那么第二种情况下和的最大值就为sum=arr[i]+…+arr[n-1]+arr[0]+…arr[j]。如果i<=j,则sum=arr[0]+…arr[n-1],【Error 2】否则sum=arr[0]+…+arr[j]+arr[i]+…arr[n-1]。就是这两个地方,当时觉得有问题。
1)先说Error 1:这里分析的出发点就是错误的,因为“跨越边界的子数组最大和与它两端子数组和是否是最大无关”,前者并非后者的充分条件,这个没有直接的理论证明,举个例子,数组[1,-2,3,5,-1,2]最大子数组和为跨界子数组[1,| 3,5,-1,2],但是[1]并非是以arr[0]开始的最大和;反过来,两端子数组和最大,这个涉及Error 2,如下
2)Error 2:反过来,两端子数组和最大(when i<=j),这个情况复杂多了,远远不是上面所说的那么简单sum= arr[0]+…arr[n-1],例如数组[8,-10,60,3,-1,-6],以arr[0]开始的最大子数组为[8,-10,60,3] ,以arr[n-1]为结尾的最大子数组为[60,3,-1,-6],且i<=j,但是整体的最大子数组却不是arr[0]-arr[n-1],而是跨界子数组[8 | 60,3,-1,-6]。
综上,这个问题不能这样思考,这也给我一个启发:一者看书要试着带有批判性的态度去看;二者别人说的不一定对,或许顺着他的思路觉得有道理,但一定要去亲自实现,实践见真知。
那么怎么做呢?
根据上面两个所举的测试用例,可以发现[1,-2,3,5,-1,2]中最大子数组去掉的是-2,而[8,-10,60,3,-1,-6]中最大子数组排除的是-10,这两个有什么特点?没错,这两个数都是两个数组中“最小”的,所以,类似的,像之前讲过的捞鱼问题,我们找最大子数组的对偶问题——最小子数组,有了最小子数组的值,总值减去它不就可以了么?但是我又想,这个对偶问题只能处理这种跨界的特殊情况吗?答案是肯定的,如果最大子数组跨界,那么剩余的中间那段和就一定是最小的,而且和必然是负的;相反,如果最大子数组不跨界,那么总值减去最小子数组的值就不一定是最大子数组和了,例如上面我们的例子[8,-10,60,3,-1,-6],最大子数组为[8 | 60,3,-1,-6],而最小子数组和为[-10],显然不能用总值减去最小值。
故,在允许数组跨界(首尾相邻)时,最大子数组的和为下面的最大值
Maxsum={ 原问题的最大子数组和;数组所有元素总值-最小子数组和 }
代码如下:
/* 如数组首尾相邻 */
int Maxsum_endtoend(int * arr, int size)
{
int maxSum_notadj = Maxsum_ultimate(arr,size); /* 不跨界的最大子数组和 */
if(maxSum_notadj < 0)
{
return maxSum_notadj; /* 全是负数 */
}
int maxSum_adj = -INF; /* 跨界的最大子数组和 */
int totalsum = 0;
int minsum = INF;
int tmpmin = 0;
for(int i = 0; i < size; ++i) /* 最小子数组和 道理跟最大是一样的 */
{
if(tmpmin > 0)
{
tmpmin = arr[i];
}else
{
tmpmin += arr[i];
}
if(tmpmin < minsum)
{
minsum = tmpmin;
}
totalsum += arr[i];
}
maxSum_adj = totalsum - minsum;
return maxSum_notadj > maxSum_adj ? maxSum_notadj : maxSum_adj;
}
给出测试用例程序:
void main()
{
/* 测试用例 */
//int arr[] = {8,-10,3,60,-1,-6};
int arr[] = {1,-2,3,5,-1,2};
int arr2[] = {-9,-2,-3,-5,-4,-6};
int len = sizeof arr / sizeof(int);
int len2 = sizeof arr2 / sizeof(int);
/* 测试三种实现 */
printf("%d %d\n",Maxsum_base(arr,len),Maxsum_base(arr2,len2));
printf("%d %d\n",Maxsum_dp(arr,len),Maxsum_dp(arr2,len2));
printf("%d %d\n",Maxsum_ultimate(arr,len),Maxsum_ultimate(arr2,len2));
/* 返回起始位置 */
int start = -1;
int end = -1;
Maxsum_location(arr,len,start,end);
printf("start:%d end:%d\n", start, end);
Maxsum_location(arr2,len2,start,end);
printf("start:%d end:%d\n", start, end);
/* 允许数组首尾相连 */
printf("%d %d\n",Maxsum_endtoend(arr,len),Maxsum_endtoend(arr2,len2));
}
思考:有木有方法可以直接处理允许数组首尾相邻的情况,即不用先求原问题的最大子数组,然后再使用对偶问题求一个值取二者最大,而是一步到位?有木有?求之。。。
- 求连续子数组的最大和
- 求连续子数组的最大和
- 求连续子数组的最大和
- 求连续子数组的最大和
- 求连续子数组的最大和
- 求连续子数组的最大和
- 求连续子数组的最大和
- 求连续子数组的最大和
- 求连续子数组的最大和
- 求连续子数组的最大和
- 求连续子数组的最大和
- 求连续子数组的最大和
- 求连续子数组的最大和
- 求连续子数组的最大和
- 求连续子数组的最大和
- 求连续子数组的最大和
- 求连续子数组的最大和
- 求连续子数组的最大和
- linux SIGFPE信号处理的疑惑
- 想和你去吹吹风(张学友演唱歌曲)
- hdu 3199 动态规划
- 筛法求素数
- java学习记录(三)集合
- 求连续子数组的最大和
- PHP函数 mysql_connect()连接MySQL数据库错误的解决办法
- isMemberOfClass 和 isKindOfClass
- sql cross join
- hdu 2544 最短路
- tomcat的常见错误
- java学习记录(四)网络编程
- hdu1874 畅通工程续 最短路
- eclipse报错:Unable to locate the Javac Compiler in: C:Program FilesJavajre6..libtools.jar