01分数规划

来源：互联网发布：数据发掘入门书籍编辑：程序博客网时间：2024/06/15 19:41

【关键字】

0/1分数规划、最优比率生成树、最优比率环

【背景】

根据楼教主的回忆录，他曾经在某一场比赛中秒掉了一道最优比率生成树问题，导致很多人跟风失败，最终悲剧。可见最优比率生成树是多么凶残的东西，但是这个东西只要好好研究半天就可以掌握，相信你在看了我写的这篇总结之后可以像楼教主一般秒掉这类问题。

因为网上对于01分数规划问题的详细资料并不是太多，所以我就结合自己的一些理解总结这种问题的解法，因为水平有限，如果有错误或是麻烦的地方，尽管喷，邮箱或是下方留言。

联系我的话perseawe@163.com，欢迎讨论，请在标题前注明[acm]或是[oi]，以免被垃圾邮件。

【知识储备】

高考数学能考84分以上的同学...... 因为只会用到公式的整理与变形，还有sigma.别说你连sigma都不会，那就没办法了。

【定义】

01分数规划问题：所谓的01分数规划问题就是指这样的一类问题，给定两个数组，a[i]表示选取i的收益，b[i]表示选取i的代价。如果选取i，定义x[i]=1否则x[i]=0。每一个物品只有选或者不选两种方案，求一个选择方案使得R=sigma(a[i]*x[i])/sigma(b[i]*x[i])取得最值，即所有选择物品的总收益/总代价的值最大或是最小。

01分数规划问题主要包含一般的01分数规划、最优比率生成树问题、最优比率环问题等。我们将会对这三个问题进行讨论。

永远要记得，我们的目标是使R取到最值，本文主要讨论取到最大值的情况。这句话我会在文中反复的强调。

【一些分析】

数学分析中一个很重要的方法就是分析目标式，这样我们来看目标式。

R=sigma(a[i]*x[i])/sigma(b[i]*x[i])

我们来分析一下他有什么性质可以给我们使用。

我们先定义一个函数F(L):=sigma(a[i]*x[i])-L*sigma(b[i]*x[i])，显然这只是对目标式的一个简单的变形。分离参数，得到F(L):=sigma((a[i]-L*b[i])*x[i])。这时我们就会发现，如果L已知的话，a[i]-L*b[i]就是已知的，当然x[i]是未知的。记d[i]=a[i]-L*b[i]，那么F(L):=sigma(d[i]*x[i])，多么简洁的式子。我们就对这些东西下手了。

再次提醒一下，我们的目标是使R取到最大值。

我们来分析一下这个函数，它与目标式的关系非常的密切，L就是目标式中的R，最大化R也就是最大化L。

F的值是由两个变量共同决定的，即方案X和参数L。对于一个确定的参数L来说，方案的不同会导致对应的F值的不同，那么这些东西对我们有什么用呢?

假设我们已知在存在一个方案X使得F(L)>0，这能够证明什么?

F(L)=sigma(a[i]*x[i])-L*sigma(b[i]*x[i])>0即sigma(a[i]*x[i])/sigma(b[i]*x[i])>L也就是说，如果一个方案使得F(L)>0说明了这组方案可以得到一个比现在的L更优的一个L，既然有一个更优的解，那么为什么不用呢？

显然，d数组是随着L的增大而单调减的。也就是说，存在一个临界的L使得不存在一种方案，能够使F(L)>0. 我们猜想，这个时候的L就是我们要求的最优解。之后更大的L值则会造成无论任何一种方案，都会使F(L)<0.类似于上面的那个变形，我们知道，F(L)<0是没有意义的，因为这时候的L是不能够被取得的。当F(L)=0使，对应方案的R值恰好等于此时的L值。

综上，函数F(L)有这样的一个性质：在前一段L中可以找到一组对应的X使得F(L)>0，这就提供了一种证据，即有一个比现在的L更优的解，而在某个L值使，存在一组解使得F(L)=0,且其他的F(L)<0，这时的L无法继续增大，即这个L就是我们期望的最优解，之后的L会使得无论哪种方案都会造成F(L)<0.而我们已经知道，F(L)<0是没有任何意义的，因为此时的L值根本取不到。

最后一次提醒，我们的目标是R！！！

如果现在你觉得有些晕的话，那么我要提醒你的就是，千万不要把F值同R值混淆。F值是根据我们的变形式求的D数组来计算的，而R值则是我们所需要的真实值，他的计算是有目标式决定的。F值只是提供了一个证据，告诉我们真正最优的R值在哪里，他与R值本身并没有什么必然的联系。

根据这样的一段性质，很自然的就可以想到二分L值，然后验证是否存在一组解使得F(L)>0，有就移动下界，没有就移动上界。

所有的01分数规划都可以这么做，唯一的区别就在于求解时的不同——因为每一道题的限制条件不同，并不是每一个解都是可行解的。比如在普通的数组中，你可以选取1、2、3号元素，但在生成树问题中，假设1、2、3号元素恰好构成了一个环，那就不能够同时选择了，这就是需要具体问题，具体分析的部分。

二分是一个非常通用的办法，但是我们来考虑这样的一个问题，二分的时候我们只是用到了F(L)>0这个条件，而对于使得F(L)>0的这组解所求到的R值没有使用。因为F(L)>0,我们已经知道了R是一个更优的解，与其漫无目的的二分，为什么不将解移动到R上去呢？求01分数规划的另一个方法就是

，他就是基于这样的一个思想，他并不会去二分答案，而是先随便给定一个答案，然后根据更优的解不断移动答案，逼近最优解。由于他对每次判定使用的更加充分，所以它比二分会快上很多。但是，他的弊端就是需要保存这个解，而我们知道，有时候验证一个解和求得一个解的复杂度是不同的。二分和Dinkelbach算法写法都非常简单，各有长处，大家要根据题目谨慎使用。

【实践】

上面啰嗦了这么多，现在给出程序框架。

二分法  L:=...;R:=...;  Repeat    Mid:=(L+R)/2;    For I=1..X do D[i]:=A[i]-Mid*B[i];//根据Mid计算D数组    if 检查（Mid）成功 then L:=Mid else R:=Mid；    Until abs(L-R)<Eps;

具体程序：

例1 Dropping Tests poj2976

给出n个物品，每个物品有两个属性a和b，选择n-k个元素，询问 $\sum{ai}/\sum{bi}$ 的最大值。

1<=n<=1000，0<=k<n，0<=ai<=bi<=1000000000。

首先这题显然是兹磁二分的，而 $\sum{ai}/\sum{bi}>=x$ 就等价于 $\sum{ai}-x*\sum{bi}>=0$ 。

所以我们发现二分完把ai-x*bi排序后把最大的n-k个选出来就行了。

#include <iostream>#include <stdio.h>#include <stdlib.h>#include <algorithm>#include <string.h>#include <vector>#include <math.h>#include <limits>#include <set>#include <map>using namespace std;int n,k,a[2333],b[2333];double ps[2333];bool ok(double x){    for(int i=1;i<=n;i++) ps[i]=a[i]-x*b[i];    sort(ps+1,ps+1+n);    double ans=0;    for(int i=n;i>=k+1;i--) ans+=ps[i];    return ans>=0;}void sol(){    for(int i=1;i<=n;i++) scanf("%d",a+i);    for(int i=1;i<=n;i++) scanf("%d",b+i);    double l=0,r=1;    while(r-l>1e-6)    {        double mid=(l+r)/2;        if(ok(mid)) l=mid; else r=mid;    }    printf("%.0lf\n",l*100);}int main(){    while(scanf("%d%d",&n,&k),n|k) sol();}

51Nod 1257 背包问题V3

N个物品的体积为W1，W2......Wn（Wi为整数），与之相对应的价值为P1,P2......Pn（Pi为整数），从中选出K件物品（K <= N)，使得单位体积的价值最大。输出单位体积的价值（用约分后的分数表示）

#include<bits/stdc++.h>using namespace std;typedef long long ll;const int maxn=50005;struct Node{    int w,p;    double rate;}node[maxn];int n,k;ll resw,resp;int answ,ansp;ll gcd(ll a,ll b){    return b==0?a:gcd(b,a%b);}bool cmp(Node a,Node b){    return a.rate>b.rate;}bool check(double p){    resw=resp=0;    double mark=0.0;    for(int i=0;i<n;i++)    {        node[i].rate=node[i].p-p*node[i].w;    }    sort(node,node+n,cmp);    for(int i=0;i<k;i++)    {        resw+=node[i].w;        resp+=node[i].p;        mark+=node[i].rate;    }    if(mark>=0)return true;    else return false;}int main(){    scanf("%d%d",&n,&k);        for(int i=0;i<n;i++){            scanf("%d%d",&node[i].w,&node[i].p);        }        double l=0.0,r=50000,mid;        while(fabs(r-l)>1e-6){             mid=(l+r)/2;            if(check(mid)){                answ=resw;                ansp=resp;                l=mid;            }            else r=mid;        }        ll gg=gcd(answ,ansp);        answ=answ/gg;        ansp=ansp/gg;        printf("%d/%d\n",ansp,answ);    return 0;}

Dinkelbach算法

程序框架

    L:=随便什么东西;      Repeat        Ans:=L;        For I=1..X do D[i]:=A[i]-L*B[i];//根据L计算D数组        检查解并记录;        p:=0;q:=0;        for I=每一个元素 do            如果元素I在解中              begin                p:=p+A[i];q:=q+A[i];              end;        L:=p/q;//更新解      Until abs(Ans-L)<Eps;

具体程序：

例1 Dropping Tests poj2976

给出n个物品，每个物品有两个属性a和b，选择n-k个元素，询问 $\sum{ai}/\sum{bi}$ 的最大值。

1<=n<=1000，0<=k<n，0<=ai<=bi<=1000000000。

首先这题显然是兹磁二分的，而 $\sum{ai}/\sum{bi}>=x$ 就等价于 $\sum{ai}-x*\sum{bi}>=0$ 。

所以我们发现二分完把ai-x*bi排序后把最大的n-k个选出来就行了。

#include <iostream>#include <stdio.h>#include <stdlib.h>#include <algorithm>#include <string.h>#include <vector>#include <math.h>#include <limits>#include <set>#include <map>using namespace std;int n,k;struct pro {double a,b,p;}s[233333];bool operator < (pro a,pro b) {return a.p<b.p;}double sol(double x){    for(int i=1;i<=n;i++) s[i].p=s[i].a-x*s[i].b;    sort(s+1,s+1+n);    double aa=0,bb=0;    for(int i=n;i>=k+1;i--) aa+=s[i].a,bb+=s[i].b;    return aa/bb;}void sol(){    for(int i=1;i<=n;i++) scanf("%lf",&s[i].a);    for(int i=1;i<=n;i++) scanf("%lf",&s[i].b);    double l=0,ans=0;    do    {        l=ans; ans=sol(ans);    }while(fabs(l-ans)>1e-6);    if(l>1) l=1;    if(l<0) l=0;    printf("%.0lf\n",l*100);}int main(){    while(scanf("%d%d",&n,&k),n|k) sol();}

51Nod 1257 背包问题V3

#include<bits/stdc++.h>using namespace std;typedef long long ll;struct Node{    ll w,p;    double d;    bool operator<(const Node &a)const    {        return d>a.d;    }}node[50005];double check(int n,int k,double rat){    int i;    for(i=1;i<=n;++i)        node[i].d=node[i].p-rat*node[i].w;    sort(node+1,node+1+n);    double W=0,P=0;    for(int i=1;i<=k;++i)        W+=node[i].w,P+=node[i].p;    return P/W;}ll gcd(ll a,ll b){    return b==0?a:gcd(b,a%b);}int main(){    int n,k,i;    scanf("%d%d",&n,&k);        for(i=1;i<=n;i++)            scanf("%I64d %I64d",&node[i].w,&node[i].p);        double ans=1,temp=1;        while(1){            temp=check(n,k,ans);            if(fabs(ans-temp)<=1e-6)                break;            ans=temp;        }        ll W=0,P=0;        for(i=1;i<=k;i++)            W+=node[i].w,P+=node[i].p;        ll g=gcd(W,P);        printf("%I64d/%I64d\n",P/g,W/g);    return 0;}

博客原址：

http://blog.csdn.net/hhaile/article/details/8883652

http://www.cnblogs.com/zzqsblog/p/5450361.html

两博客整合。。。

阅读全文

0 0