[微软]有两个序列a,b,大小都为n,序列元素的值任意整数,无序; 要求:通过交换a,b中的元素,使[序列a元素的和]与[序列b元素的和]之间的差最小

来源:互联网 发布:apache 两个httpd.exe 编辑:程序博客网 时间:2024/06/08 17:49

[微软]有两个序列a,b,大小都为n,序列元素的值任意整数,无序; 要求:通过交换a,b中的元素,使[序列a元素的和]与[序列b元素的和]之间的差最小

分类: 算法与数据结构 4976人阅读 评论(0)收藏举报
微软算法n2tree优化c

搜了网上的一些文章,看到一个看似很巧的搜索方法,描述于文http://blog.csdn.net/tianshuai11/article/details/7479767中。转述如下:

第一种算法:
   当前数组a和数组b的和之差为
   A = sum(a) - sum(b)

   a的第i个元素和b的第j个元素交换后,a和b的和之差为
   A' = sum(a) - a[i] + b[j] - (sum(b)- b[j] + a[i])
          = sum(a) - sum(b) - 2 (a[i] - b[j])
          = A - 2 (a[i] - b[j])

    设x= a[i] - b[j]
    |A| - |A'| = |A| - |A-2x|

    假设A> 0,
    当x在(0,A)之间时,做这样的交换才能使得交换后的a和b的和之差变小,
x越接近A/2效果越好,
   如果找不到在(0,A)之间的x,则当前的a和b就是答案。

    所以算法大概如下:
   在a和b中寻找使得x在(0,A)之间并且最接近A/2的i和j,交换相应的i和j元素,
重新计算A后,重复前面的步骤直至找不到(0,A)之间的x为止。

代码:

[cpp] view plaincopyprint?
  1. #include <iostream>   
  2. using namespace std;  
  3. class RunClass  
  4. {  
  5.    public:  
  6.          void BalanceArray( int array1[],  int array2[],int n1,int n2);  
  7.    private:  
  8.           int Sum(int array[],int n);  
  9. };  
  10.   
  11. void RunClass::BalanceArray(int array1[], int array2[],int n1,int n2)  
  12. {  
  13.   
  14.      if (n1 != n2)  
  15.           return;  
  16.      int *array=new int[n1];  
  17.      if (Sum(array1,n1) < Sum(array2,n2))  
  18.      {  
  19.   
  20.            array= array1;  
  21.            array1 = array2;  
  22.            array2 = array;  
  23.      }  
  24.             bool ifCycle = true;  
  25.             int length = n1;  
  26.             while (ifCycle)  
  27.             {  
  28.                ifCycle = false;       
  29.                 for (int i = 0; i < length; i++)  
  30.                 {  
  31.                     for (int j = 0; j < length; j++)  
  32.                     {  
  33.                         int itemValue = array1[i] - array2[j];  
  34.                         int sumValue = Sum(array1,n1) - Sum(array2,n2);  
  35.                         if (itemValue < sumValue && itemValue > 0)  
  36.                         {  
  37.                             ifCycle = true;  
  38.                             int item = array1[i];  
  39.                             array1[i] = array2[j];  
  40.                             array2[j] = item;  
  41.                         }  
  42.                     }  
  43.                 }  
  44.             }  
  45. }  
  46.   
  47. int RunClass::Sum(int array[],int n)  
  48. {  
  49.        int sum = 0;  
  50.   
  51.        for (int i = 0; i < n; i++)  
  52.         {  
  53.           sum += array[i];  
  54.         }  
  55.        return sum;  
  56.  }  
  57.   
  58. int main()  
  59. {  
  60.    int array1[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 90, 0, 0, 100 };  
  61.    int array2[] = { -1, -2, -100, -3, 99, -222, -2, -3, -5, -88, 11, 12, 13 };  
  62.   
  63.    RunClass  a;  
  64.    a.BalanceArray(array1, array2,13,13);  
  65.   
  66.    for(int i=0;i<13;i++)  
  67.        cout<<array1[i]<<"  ";  
  68.    cout<<endl;  
  69.   
  70.    for(int i=0;i<13;i++)  
  71.        cout<<array2[i]<<"  ";  
  72.    cout<<endl;  
  73.   
  74.    return 0;  
  75.   
  76.  }  
但是,上述方法却有缺陷,因为一次只允许交换一对元素,这对于一次需要交换两个元素的数组而言将出错,考虑如下情况:
A = { 5,5,9,10 };
B = { 4,7,7,13 };
A的和为29,B为31。当把A中的5,5与B中的4,7交换后,A与B的和都为30,差为0.但上述算法一将检测不到这种交换!因此输出结果是原数组。

算法二:回溯法。

这里仅转文字描述,代码请参考:http://blog.csdn.net/ljsspace/article/details/6434621#

分析:

通过交换的方式,最终的状态是在保证两个序列中元素个数相同的条件下,任何一个元素都可以位于两个序列中的任何一个。这样问题可以转化为:在一个长度为2*n的整数序列中,如何将元素个数分成两个子集,记每个子集的元素之和分别为S1和S2,使得|S1-S2|最小。显然这是一个最优化问题,如果用brute-force方法,组合数是C(2n,n)=(2n)!/(2*(n!)), 如果n很大这个方法不奏效。

这里采用回溯法(backtracking),即前序(preorder)遍历状态空间树(state-space tree)。难点在于剪枝条件的确定,下面说明如何确定剪枝条件:

注意到如果将原序列按从小到大的顺序排好序,每次从较大的元素开始取,可以得到一个这样的规律:设长度为2*n序列的元素总和为Sigma,当前集合元素的和为S,剩下的元素之和为Sigma-S,如果二者满足S>=Sigma-S,即Sigma<=2*S,那么在当前集合中剩下需要添加进来的元素必须从余下的元素中取最小的那些元素,这样才能保证|S1-S2|最小。这是因为如果在下一次任意从余下的元素中取的元素分别为e和f,那么取e后的两个子集差为(S+e) - (Sigma-S-e) = 2S-Sigma +2e,取f后的两个子集差为2S-Sigma +2f,显然如果e>f>0, 则有前者的子集差大于后者的子集差(注意这里假设元素都为非负整数,原序列中有负数的情况参考下面的讨论)。

如果输入序列中有负整数,可以通过平移操作转化为非负,因为每个数都平移了,它们的差值保值不变。如果不平移,结果不一定正确,比如:输入的2*n序列为:-10,5,3,20,25,50,平衡的对半子集应该为[-10,5,50]和[3,20,25],差值的绝对值为3。在下面的实现中,如果不考虑平移,得到的错误结果却是[-10,3,50]和[5,20,25],差值的绝对值为7。

另外在状态空间树只需要考虑根节点的左枝子树,因为原问题考虑的是对半子集。(博主的意思是否是说,在搜索时,其实只需要搜一半,比如S大于等于sigma/2的那一半,而不必全盘搜索。因此,当当前的N个值之和已经小于或等于S时,已经不必要再往下找了!因为是从数组最大的值往前搜索的,越尝试得到的S只会越小)

评:几个关键点:排序、平移、剪枝、对半子集。

0 0