求连续子数组的最大和

来源：互联网发布：键盘记录软件哪个好编辑：程序博客网时间：2024/05/17 00:04

原文地址：http://blog.csdn.net/v_JULY_v/article/details/6444021

第一节、求子数组的最大和
3.求子数组的最大和
题目描述：
输入一个整形数组，数组里有正数也有负数。
数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。
求所有子数组的和的最大值。要求时间复杂度为O(n)。

例如输入的数组为1, -2, 3, 10, -4, 7, 2, -5，和最大的子数组为3, 10, -4, 7, 2，
因此输出为该子数组的和18。

分析：这个问题在各大公司面试中出现频率之频繁，被人引用次数之多，非一般面试题可与之匹敌。单凭这点，就没有理由不入选狂想曲系列中了。此题曾作为本人之前整理的微软100题中的第3题，至今反响也很大。ok，下面，咱们来一步一步分析这个题：
1、求一个数组的最大子数组和，如此序列1, -2, 3, 10, -4, 7, 2, -5，我想最最直观也是最野蛮的办法便是，三个for循环三层遍历，求出数组中每一个子数组的和，最终求出这些子数组的最大的一个值。
记Sum[i, …, j]为数组A中第i个元素到第j个元素的和（其中0 <= i <= j < n），遍历所有可能的Sum[i, …, j]，那么时间复杂度为O（N^3）：

//本段代码引自编程之美
int MaxSum(int* A, int n)
{
int maximum = -INF;
int sum=0;
for(int i = 0; i < n; i++)
{
  for(int j = i; j < n; j++)
  {
   for(int k = i; k <= j; k++)
   {
    sum += A[k];
   }
   if(sum > maximum)
    maximum = sum;
   sum=0;   //这里要记得清零，否则的话sum最终存放的是所有子数组的和。也就是编程之美上所说的bug。多谢苍狼。
  }
}
return maximum;
}

2、其实这个问题，在我之前上传的微软100题，答案V0.2版[第1-20题答案]，便直接给出了以下O（N）的算法：

//copyright@ July 2010/10/18  
//updated，2011.05.25.  
#include <iostream.h>  
  
int maxSum(int* a, int n)  
{  
    int sum=0;  
    //其实要处理全是负数的情况，很简单，如稍后下面第3点所见，直接把这句改成："int sum=a[0]"即可  
    //也可以不改，当全是负数的情况，直接返回0，也不见得不行。  
    int b=0;  
      
    for(int i=0; i<n; i++)  
    {  
        if(b<0)           //...  
            b=a[i];  
        else  
            b+=a[i];  
        if(sum<b)  
            sum=b;  
    }  
    return sum;  
}  
  
int main()  
{  
    int a[10]={1, -2, 3, 10, -4, 7, 2, -5};  
    //int a[]={-1,-2,-3,-4};  //测试全是负数的用例  
    cout<<maxSum(a,8)<<endl;  
    return 0;  
}  
  
/*------------------------------------- 
解释下： 
例如输入的数组为1, -2, 3, 10, -4, 7, 2, -5， 
那么最大的子数组为3, 10, -4, 7, 2， 
因此输出为该子数组的和18。 
 
所有的东西都在以下俩行， 
即： 
b  ：  0  1  -1  3  13   9  16  18  13   
sum：  0  1   1  3  13  13  16  18  18 
   
其实算法很简单，当前面的几个数，加起来后，b<0后， 
把b重新赋值，置为下一个元素，b=a[i]。 
当b>sum，则更新sum=b; 
若b<sum，则sum保持原值，不更新。。July、10/31。 
----------------------------------*/  

3、不少朋友看到上面的答案之后，认为上述思路2的代码，没有处理全是负数的情况，当全是负数的情况时，我们可以让程序返回0，也可以让其返回最大的那个负数，下面便是前几日重写的，修改后的处理全是负数情况（返回最大的负数）的代码：

//copyright@ July  
//July、updated，2011.05.25。  
#include <iostream.h>  
#define n 4           //多定义了一个变量  
  
int maxsum(int a[n])    
//于此处，你能看到上述思路2代码（指针）的优势  
{  
    int max=a[0];       //全负情况，返回最大数  
    int sum=0;  
    for(int j=0;j<n;j++)  
    {  
        if(sum>=0)     //如果加上某个元素，sum>=0的话，就加  
            sum+=a[j];  
        else     
            sum=a[j];  //如果加上某个元素，sum<0了，就不加  
        if(sum>max)  
            max=sum;  
    }  
    return max;  
}  
  
int main()  
{  
    int a[]={-1,-2,-3,-4};  
    cout<<maxsum(a)<<endl;  
    return 0;  
}  

4、DP解法的具体方程：@ flyinghearts：设sum[i] 为前i个元素中，包含第i个元素且和最大的连续子数组，result 为已找到的子数组中和最大的。对第i+1个元素有两种选择：做为新子数组的第一个元素、放入前面找到的子数组。
sum[i+1] = max(a[i+1], sum[i] + a[i+1])
result = max(result, sum[i])

扩展：
1、如果数组是二维数组，同样要你求最大子数组的和列?
2、如果是要你求子数组的最大乘积列?
3、如果同时要求输出子段的开始和结束列?

第二节、Data structures and Algorithm analysis in C

下面给出《Data structures and Algorithm analysis in C》中4种实现。

//感谢网友firo  
//July、2010.06.05。  
  
//Algorithm 1:时间效率为O(n*n*n)  
int MaxSubsequenceSum1(const int A[],int N)  
{  
    int ThisSum=0 ,MaxSum=0,i,j,k;  
    for(i=0;i<N;i++)  
        for(j=i;j<N;j++)  
        {  
            ThisSum=0;  
            for(k=i;k<j;k++)  
                ThisSum+=A[k];  
              
            if(ThisSum>MaxSum)  
                MaxSum=ThisSum;  
        }  
        return MaxSum;  
}  
  
//Algorithm 2:时间效率为O(n*n)  
int MaxSubsequenceSum2(const int A[],int N)  
{  
    int ThisSum=0,MaxSum=0,i,j,k;  
    for(i=0;i<N;i++)  
    {  
        ThisSum=0;  
        for(j=i;j<N;j++)  
        {  
            ThisSum+=A[j];  
            if(ThisSum>MaxSum)  
                MaxSum=ThisSum;  
        }  
    }  
    return MaxSum;  
}  
  
//Algorithm 3:时间效率为O(n*log n)  
//算法3的主要思想：采用二分策略，将序列分成左右两份。  
//那么最长子序列有三种可能出现的情况，即  
//【1】只出现在左部分.  
//【2】只出现在右部分。  
//【3】出现在中间，同时涉及到左右两部分。  
//分情况讨论之。  
static int MaxSubSum(const int A[],int Left,int Right)  
{  
    int MaxLeftSum,MaxRightSum;              //左、右部分最大连续子序列值。对应情况【1】、【2】  
    int MaxLeftBorderSum,MaxRightBorderSum;  //从中间分别到左右两侧的最大连续子序列值，对应case【3】。  
    int LeftBorderSum,RightBorderSum;  
    int Center,i;  
    if(Left == Right)Base Case  
        if(A[Left]>0)  
            return A[Left];  
        else  
            return 0;  
        Center=(Left+Right)/2;  
        MaxLeftSum=MaxSubSum(A,Left,Center);  
        MaxRightSum=MaxSubSum(A,Center+1,Right);  
        MaxLeftBorderSum=0;  
        LeftBorderSum=0;  
        for(i=Center;i>=Left;i--)  
        {  
            LeftBorderSum+=A[i];  
            if(LeftBorderSum>MaxLeftBorderSum)  
                MaxLeftBorderSum=LeftBorderSum;  
        }  
        MaxRightBorderSum=0;  
        RightBorderSum=0;  
        for(i=Center+1;i<=Right;i++)  
        {  
            RightBorderSum+=A[i];  
            if(RightBorderSum>MaxRightBorderSum)  
                MaxRightBorderSum=RightBorderSum;  
        }  
        int max1=MaxLeftSum>MaxRightSum?MaxLeftSum:MaxRightSum;  
        int max2=MaxLeftBorderSum+MaxRightBorderSum;  
        return max1>max2?max1:max2;  
}  
  
//Algorithm 4:时间效率为O(n)  
//同上述第一节中的思路3、和4。  
int MaxSubsequenceSum(const int A[],int N)  
{  
    int ThisSum,MaxSum,j;  
    ThisSum=MaxSum=0;  
    for(j=0;j<N;j++)  
    {  
        ThisSum+=A[j];  
        if(ThisSum>MaxSum)  
            MaxSum=ThisSum;  
        else if(ThisSum<0)  
            ThisSum=0;  
    }  
    return MaxSum;  
}   

返回最大子数组始末位置

这个问题是《编程之美》2.14的扩展问题，返回始末位置还是比较容易的，我们知道，每当当前子数组和的小于0时，便是新一轮子数组的开始，每当更新最大和时，便对应可能的结束下标，这个时候，只要顺便用本轮的起始和结束位置更新始末位置就可以，程序结束，最大子数组和以及其始末位置便一起被记录下来了，代码如下：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
/* 最大子数组 返回起始位置 */
void Maxsum_location(int * arr, int size, int & start, int & end)
{
    int maxSum = -INF;
    int sum = 0;
    int curstart = start = 0;  /* curstart记录每次当前起始位置 */
    for(int i = 0; i < size; ++i)
    {
        if(sum < 0)
        {
            sum = arr[i];
            curstart = i;     /* 记录当前的起始位置 */
        }else
        {
            sum += arr[i];
        }
        if(sum > maxSum)
        {
            maxSum = sum;
            start = curstart; /* 记录并更新最大子数组起始位置 */
            end = i;
        }
    }
}

==================================

数组首尾相连【《编程之美》解法错误分析】

这个也是2.14的扩展问题，如果数组arr[0],…,arr[n-1]首尾相邻，也就是允许找到一段数字arr[i],…,arr[n-1],arr[0],…,a[j]，使其和最大，该如何？

编程之美解法：这个问题的解可以分为两种情况：

1）解没有跨越arr[n-1]到arr[0] （原问题）

2）解跨越arr[n-1]到arr[0]

对于第二种情况，只要找到从arr[0]开始和最大的一段（arr[0],…,arr[j]）以及以arr[n-1]结尾的和最大的一段（arr[i],…,arr[n-1]）【Error 1】,那么第二种情况下和的最大值就为sum=arr[i]+…+arr[n-1]+arr[0]+…arr[j]。如果i<=j，则sum=arr[0]+…arr[n-1]，【Error 2】否则sum=arr[0]+…+arr[j]+arr[i]+…arr[n-1]。就是这两个地方，当时觉得有问题。

1）先说Error 1：这里分析的出发点就是错误的，因为“跨越边界的子数组最大和与它两端子数组和是否是最大无关”，前者并非后者的充分条件，这个没有直接的理论证明，举个例子，数组[1，-2，3，5，-1，2]最大子数组和为跨界子数组[1，| 3，5，-1，2]，但是[1]并非是以arr[0]开始的最大和；反过来，两端子数组和最大，这个涉及Error 2，如下

2）Error 2：反过来，两端子数组和最大（when i<=j），这个情况复杂多了，远远不是上面所说的那么简单sum= arr[0]+…arr[n-1]，例如数组[8，-10，60，3，-1，-6]，以arr[0]开始的最大子数组为[8，-10，60，3] ，以arr[n-1]为结尾的最大子数组为[60，3，-1，-6]，且i<=j，但是整体的最大子数组却不是arr[0]-arr[n-1]，而是跨界子数组[8 | 60，3，-1，-6]。

综上，这个问题不能这样思考，这也给我一个启发：一者看书要试着带有批判性的态度去看；二者别人说的不一定对，或许顺着他的思路觉得有道理，但一定要去亲自实现，实践见真知。

那么怎么做呢？

根据上面两个所举的测试用例，可以发现[1，-2，3，5，-1，2]中最大子数组去掉的是-2，而[8，-10，60，3，-1，-6]中最大子数组排除的是-10，这两个有什么特点？没错，这两个数都是两个数组中“最小”的，所以，类似的，像之前讲过的捞鱼问题，我们找最大子数组的对偶问题——最小子数组，有了最小子数组的值，总值减去它不就可以了么？但是我又想，这个对偶问题只能处理这种跨界的特殊情况吗？答案是肯定的，如果最大子数组跨界，那么剩余的中间那段和就一定是最小的，而且和必然是负的；相反，如果最大子数组不跨界，那么总值减去最小子数组的值就不一定是最大子数组和了，例如上面我们的例子[8，-10，60，3，-1，-6]，最大子数组为[8 | 60，3，-1，-6]，而最小子数组和为[-10]，显然不能用总值减去最小值。

故，在允许数组跨界（首尾相邻）时，最大子数组的和为下面的最大值

Maxsum={ 原问题的最大子数组和；数组所有元素总值-最小子数组和 }

代码如下：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
/* 如数组首尾相邻 */
int Maxsum_endtoend(int * arr, int size)
{
    int maxSum_notadj = Maxsum_ultimate(arr,size); /* 不跨界的最大子数组和 */
    if(maxSum_notadj < 0)
    {
        return maxSum_notadj;                      /* 全是负数 */
    }
    int maxSum_adj = -INF;                         /* 跨界的最大子数组和 */
    int totalsum = 0;
    int minsum = INF;
    int tmpmin = 0;
    for(int i = 0; i < size; ++i)     /* 最小子数组和 道理跟最大是一样的 */
    {
        if(tmpmin > 0)
        {
            tmpmin = arr[i];
        }else
        {
            tmpmin += arr[i];
        }
        if(tmpmin < minsum)
        {
            minsum = tmpmin;
        }
        totalsum += arr[i];
    }
    maxSum_adj = totalsum - minsum;
    return maxSum_notadj > maxSum_adj ? maxSum_notadj : maxSum_adj;
}

给出测试用例程序：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
void main()
{
    /* 测试用例 */
    //int arr[] = {8,-10,3,60,-1,-6};
    int arr[] = {1,-2,3,5,-1,2};
    int arr2[] = {-9,-2,-3,-5,-4,-6};
    int len = sizeof arr / sizeof(int);
    int len2 = sizeof arr2 / sizeof(int);
 
    /* 测试三种实现 */
    printf("%d %d\n",Maxsum_base(arr,len),Maxsum_base(arr2,len2));
    printf("%d %d\n",Maxsum_dp(arr,len),Maxsum_dp(arr2,len2));
    printf("%d %d\n",Maxsum_ultimate(arr,len),Maxsum_ultimate(arr2,len2));
 
    /* 返回起始位置 */
    int start = -1;
    int end = -1;
    Maxsum_location(arr,len,start,end);
    printf("start：%d end：%d\n", start, end);
    Maxsum_location(arr2,len2,start,end);
    printf("start：%d end：%d\n", start, end);
 
    /* 允许数组首尾相连 */
    printf("%d %d\n",Maxsum_endtoend(arr,len),Maxsum_endtoend(arr2,len2));
}

思考：有木有方法可以直接处理允许数组首尾相邻的情况，即不用先求原问题的最大子数组，然后再使用对偶问题求一个值取二者最大，而是一步到位？有木有？求之。。。

0 0