01分数规划

来源:互联网 发布:数据发掘入门书籍 编辑:程序博客网 时间:2024/06/15 19:41
【关键字】

0/1分数规划、最优比率生成树、最优比率环

【背景】

 根据楼教主的回忆录,他曾经在某一场比赛中秒掉了一道最优比率生成树问题,导致很多人跟风失败,最终悲剧。可见最优比率生成树是多么凶残的东西,但是这个东西只要好好研究半天就可以掌握,相信你在看了我写的这篇总结之后可以像楼教主一般秒掉这类问题。

因为网上对于01分数规划问题的详细资料并不是太多,所以我就结合自己的一些理解总结这种问题的解法,因为水平有限,如果有错误或是麻烦的地方,尽管喷,邮箱或是下方留言。

联系我的话perseawe@163.com,欢迎讨论,请在标题前注明[acm]或是[oi],以免被垃圾邮件。

 

【知识储备】

高考数学能考84分以上的同学...... 因为只会用到公式的整理与变形,还有sigma.别说你连sigma都不会,那就没办法了。

 

【定义】

01分数规划问题:所谓的01分数规划问题就是指这样的一类问题,给定两个数组,a[i]表示选取i的收益,b[i]表示选取i的代价。如果选取i,定义x[i]=1否则x[i]=0。每一个物品只有选或者不选两种方案,求一个选择方案使得R=sigma(a[i]*x[i])/sigma(b[i]*x[i])取得最值,即所有选择物品的总收益/总代价的值最大或是最小。

01分数规划问题主要包含一般的01分数规划、最优比率生成树问题、最优比率环问题等。我们将会对这三个问题进行讨论。

 

永远要记得,我们的目标是使R取到最值,本文主要讨论取到最大值的情况。这句话我会在文中反复的强调。

 

【一些分析】

 数学分析中一个很重要的方法就是分析目标式,这样我们来看目标式。

R=sigma(a[i]*x[i])/sigma(b[i]*x[i])

我们来分析一下他有什么性质可以给我们使用。

我们先定义一个函数F(L):=sigma(a[i]*x[i])-L*sigma(b[i]*x[i]),显然这只是对目标式的一个简单的变形。分离参数,得到F(L):=sigma((a[i]-L*b[i])*x[i])。这时我们就会发现,如果L已知的话,a[i]-L*b[i]就是已知的,当然x[i]是未知的。记d[i]=a[i]-L*b[i],那么F(L):=sigma(d[i]*x[i]),多么简洁的式子。我们就对这些东西下手了。

再次提醒一下,我们的目标是使R取到最大值。

我们来分析一下这个函数,它与目标式的关系非常的密切,L就是目标式中的R,最大化R也就是最大化L。

F的值是由两个变量共同决定的,即方案X和参数L。对于一个确定的参数L来说,方案的不同会导致对应的F值的不同,那么这些东西对我们有什么用呢?

假设我们已知在存在一个方案X使得F(L)>0,这能够证明什么?

F(L)=sigma(a[i]*x[i])-L*sigma(b[i]*x[i])>0即sigma(a[i]*x[i])/sigma(b[i]*x[i])>L也就是说,如果一个方案使得F(L)>0说明了这组方案可以得到一个比现在的L更优的一个L,既然有一个更优的解,那么为什么不用呢?

显然,d数组是随着L的增大而单调减的。也就是说,存在一个临界的L使得不存在一种方案,能够使F(L)>0. 我们猜想,这个时候的L就是我们要求的最优解。之后更大的L值则会造成无论任何一种方案,都会使F(L)<0.类似于上面的那个变形,我们知道,F(L)<0是没有意义的,因为这时候的L是不能够被取得的。当F(L)=0使,对应方案的R值恰好等于此时的L值。

 综上,函数F(L)有这样的一个性质:在前一段L中可以找到一组对应的X使得F(L)>0,这就提供了一种证据,即有一个比现在的L更优的解,而在某个L值使,存在一组解使得F(L)=0,且其他的F(L)<0,这时的L无法继续增大,即这个L就是我们期望的最优解,之后的L会使得无论哪种方案都会造成F(L)<0.而我们已经知道,F(L)<0是没有任何意义的,因为此时的L值根本取不到。

最后一次提醒,我们的目标是R!!!

如果现在你觉得有些晕的话,那么我要提醒你的就是,千万不要把F值同R值混淆。F值是根据我们的变形式求的D数组来计算的,而R值则是我们所需要的真实值,他的计算是有目标式决定的。F值只是提供了一个证据,告诉我们真正最优的R值在哪里,他与R值本身并没有什么必然的联系。

根据这样的一段性质,很自然的就可以想到二分L值,然后验证是否存在一组解使得F(L)>0,有就移动下界,没有就移动上界。

 所有的01分数规划都可以这么做,唯一的区别就在于求解时的不同——因为每一道题的限制条件不同,并不是每一个解都是可行解的。比如在普通的数组中,你可以选取1、2、3号元素,但在生成树问题中,假设1、2、3号元素恰好构成了一个环,那就不能够同时选择了,这就是需要具体问题,具体分析的部分。

二分是一个非常通用的办法,但是我们来考虑这样的一个问题,二分的时候我们只是用到了F(L)>0这个条件,而对于使得F(L)>0的这组解所求到的R值没有使用。因为F(L)>0,我们已经知道了R是一个更优的解,与其漫无目的的二分,为什么不将解移动到R上去呢?求01分数规划的另一个方法就是

,他就是基于这样的一个思想,他并不会去二分答案,而是先随便给定一个答案,然后根据更优的解不断移动答案,逼近最优解。由于他对每次判定使用的更加充分,所以它比二分会快上很多。但是,他的弊端就是需要保存这个解,而我们知道,有时候验证一个解和求得一个解的复杂度是不同的。二分和Dinkelbach算法写法都非常简单,各有长处,大家要根据题目谨慎使用。

【实践】

上面啰嗦了这么多,现在给出程序框架。

二分法  L:=...;R:=...;  Repeat    Mid:=(L+R)/2;    For I=1..X do D[i]:=A[i]-Mid*B[i];//根据Mid计算D数组    if 检查(Mid)成功 then L:=Mid else R:=Mid;    Until abs(L-R)<Eps;


具体程序:

例1 Dropping Tests poj2976

给出n个物品,每个物品有两个属性a和b,选择n-k个元素,询问\sum{ai}/\sum{bi}的最大值。

1<=n<=1000,0<=k<n,0<=ai<=bi<=1000000000。

首先这题显然是兹磁二分的,而\sum{ai}/\sum{bi}>=x就等价于\sum{ai}-x*\sum{bi}>=0

所以我们发现二分完把ai-x*bi排序后把最大的n-k个选出来就行了。


#include <iostream>#include <stdio.h>#include <stdlib.h>#include <algorithm>#include <string.h>#include <vector>#include <math.h>#include <limits>#include <set>#include <map>using namespace std;int n,k,a[2333],b[2333];double ps[2333];bool ok(double x){    for(int i=1;i<=n;i++) ps[i]=a[i]-x*b[i];    sort(ps+1,ps+1+n);    double ans=0;    for(int i=n;i>=k+1;i--) ans+=ps[i];    return ans>=0;}void sol(){    for(int i=1;i<=n;i++) scanf("%d",a+i);    for(int i=1;i<=n;i++) scanf("%d",b+i);    double l=0,r=1;    while(r-l>1e-6)    {        double mid=(l+r)/2;        if(ok(mid)) l=mid; else r=mid;    }    printf("%.0lf\n",l*100);}int main(){    while(scanf("%d%d",&n,&k),n|k) sol();}

51Nod 1257 背包问题V3

N个物品的体积为W1,W2......Wn(Wi为整数),与之相对应的价值为P1,P2......Pn(Pi为整数),从中选出K件物品(K <= N),使得单位体积的价值最大。输出单位体积的价值(用约分后的分数表示)

#include<bits/stdc++.h>using namespace std;typedef long long ll;const int maxn=50005;struct Node{    int w,p;    double rate;}node[maxn];int n,k;ll resw,resp;int answ,ansp;ll gcd(ll a,ll b){    return b==0?a:gcd(b,a%b);}bool cmp(Node a,Node b){    return a.rate>b.rate;}bool check(double p){    resw=resp=0;    double mark=0.0;    for(int i=0;i<n;i++)    {        node[i].rate=node[i].p-p*node[i].w;    }    sort(node,node+n,cmp);    for(int i=0;i<k;i++)    {        resw+=node[i].w;        resp+=node[i].p;        mark+=node[i].rate;    }    if(mark>=0)return true;    else return false;}int main(){    scanf("%d%d",&n,&k);        for(int i=0;i<n;i++){            scanf("%d%d",&node[i].w,&node[i].p);        }        double l=0.0,r=50000,mid;        while(fabs(r-l)>1e-6){             mid=(l+r)/2;            if(check(mid)){                answ=resw;                ansp=resp;                l=mid;            }            else r=mid;        }        ll gg=gcd(answ,ansp);        answ=answ/gg;        ansp=ansp/gg;        printf("%d/%d\n",ansp,answ);    return 0;}




Dinkelbach算法

程序框架

    L:=随便什么东西;      Repeat        Ans:=L;        For I=1..X do D[i]:=A[i]-L*B[i];//根据L计算D数组        检查解并记录;        p:=0;q:=0;        for I=每一个元素 do            如果元素I在解中              begin                p:=p+A[i];q:=q+A[i];              end;        L:=p/q;//更新解      Until abs(Ans-L)<Eps;  

具体程序:

例1 Dropping Tests poj2976

给出n个物品,每个物品有两个属性a和b,选择n-k个元素,询问\sum{ai}/\sum{bi}的最大值。

1<=n<=1000,0<=k<n,0<=ai<=bi<=1000000000。

首先这题显然是兹磁二分的,而\sum{ai}/\sum{bi}>=x就等价于\sum{ai}-x*\sum{bi}>=0

所以我们发现二分完把ai-x*bi排序后把最大的n-k个选出来就行了。

#include <iostream>#include <stdio.h>#include <stdlib.h>#include <algorithm>#include <string.h>#include <vector>#include <math.h>#include <limits>#include <set>#include <map>using namespace std;int n,k;struct pro {double a,b,p;}s[233333];bool operator < (pro a,pro b) {return a.p<b.p;}double sol(double x){    for(int i=1;i<=n;i++) s[i].p=s[i].a-x*s[i].b;    sort(s+1,s+1+n);    double aa=0,bb=0;    for(int i=n;i>=k+1;i--) aa+=s[i].a,bb+=s[i].b;    return aa/bb;}void sol(){    for(int i=1;i<=n;i++) scanf("%lf",&s[i].a);    for(int i=1;i<=n;i++) scanf("%lf",&s[i].b);    double l=0,ans=0;    do    {        l=ans; ans=sol(ans);    }while(fabs(l-ans)>1e-6);    if(l>1) l=1;    if(l<0) l=0;    printf("%.0lf\n",l*100);}int main(){    while(scanf("%d%d",&n,&k),n|k) sol();}

51Nod 1257 背包问题V3

N个物品的体积为W1,W2......Wn(Wi为整数),与之相对应的价值为P1,P2......Pn(Pi为整数),从中选出K件物品(K <= N),使得单位体积的价值最大。输出单位体积的价值(用约分后的分数表示)

#include<bits/stdc++.h>using namespace std;typedef long long ll;struct Node{    ll w,p;    double d;    bool operator<(const Node &a)const    {        return d>a.d;    }}node[50005];double check(int n,int k,double rat){    int i;    for(i=1;i<=n;++i)        node[i].d=node[i].p-rat*node[i].w;    sort(node+1,node+1+n);    double W=0,P=0;    for(int i=1;i<=k;++i)        W+=node[i].w,P+=node[i].p;    return P/W;}ll gcd(ll a,ll b){    return b==0?a:gcd(b,a%b);}int main(){    int n,k,i;    scanf("%d%d",&n,&k);        for(i=1;i<=n;i++)            scanf("%I64d %I64d",&node[i].w,&node[i].p);        double ans=1,temp=1;        while(1){            temp=check(n,k,ans);            if(fabs(ans-temp)<=1e-6)                break;            ans=temp;        }        ll W=0,P=0;        for(i=1;i<=k;i++)            W+=node[i].w,P+=node[i].p;        ll g=gcd(W,P);        printf("%I64d/%I64d\n",P/g,W/g);    return 0;}




博客原址:

http://blog.csdn.net/hhaile/article/details/8883652

http://www.cnblogs.com/zzqsblog/p/5450361.html

两博客整合。。。

原创粉丝点击