四边形不等式优化动态规划

来源：互联网发布：林海峰栋笃笑知乎编辑：程序博客网时间：2024/05/17 04:16

原文出处（大牛写的，我抄了一遍）

先转下来，明天再看！

四边形不等式优化动态规划原理:

1.当决策代价函数w[i][j]满足w[i][j]+w[i’][j’]<=w[I;][j]+w[i][j’](i<=i’<=j<=j’)时,称w满足四边形不等式.当函数w[i][j]满足w[i’][j]<=w[i][j’] i<=i’<=j<=j’)时,称w关于区间包含关系单调.

2.如果状态转移方程m为 : m[i][j]=min {m[i][k-1]+m[k][j]+w[i][j]} , (i<k<=j),且决策代价w满足四边形不等式的单调函数(可以推导出m亦为满足四边形不等式的单调函数),则可利用四边形不等式推出最优决策s的单调函数性,从而减少每个状态的状态数,将算法的时间复杂度由原来的O(n^3)降低为O(n^2).方法是通过记录子区间的最优决策来减少当前的决策量.令:

s[i][j]=max{k | ma[i][j] = m[i][k-1] + m[k][j] + w[i][j]}

由于决策s具有单调性,因此状态转移方程可修改为:

m[i][j]=min {m[i][k-1]+m[k][j]+w[i][j]} , (s[i][j-1]<=k<=s[i+1][j])

证明过程: (转载)

设m[i,j]表示动态规划的状态量。

m[i,j]有类似如下的状态转移方程：

m[i,j]=opt{m[i,k]+m[k,j]}(i≤k≤j)

如果对于任意的a≤b≤c≤d，有m[a,c]+m[b,d]≤m[a,d]+m[b,c]，那么m[i,j]满足四边形不等式。

以上是适用这种优化方法的必要条件

对于一道具体的题目，我们首先要证明它满足这个条件，一般来说用数学归纳法证明，根据题目的不同而不同。

通常的动态规划的复杂度是O(n³)，我们可以优化到O(n²)

设s[i,j]为m[i,j]的决策量，即m[i,j]=m[i,s[i,j]]+m[s[i,j]+j]

我们可以证明，s[i,j-1]≤s[i,j]≤s[i+1,j] （证明过程见下）

那么改变状态转移方程为：

m[i,j]=opt{m[i,k]+m[k,j]} (s[i,j-1]≤k≤s[i+1,j])

复杂度分析：不难看出，复杂度决定于s的值，以求m[i,i+L]为例，

(s[2,L+1]-s[1,L])+(s[3,L+2]-s[2,L+1])…+(s[n-L+1,n]-s[n-L,n-1])=s[n-L+1,n]-s[1,L]≤n

所以总复杂度是O(n²)

对s[i,j-1]≤s[i,j]≤s[i+1,j]的证明：

设m_k[i,j]=m[i,k]+m[k,j]，s[i,j]=d

对于任意k<d，有m_k[i,j]≥m_d[i,j]（这里以m[i,j]=min{m[i,k]+m[k,j]}为例,max的类似），接下来只要证明m_k[i+1,j]≥m_d[i+1,j]，那么只有当s[i+1,j]≥s[i,j]时才有可能有m_s[i+1,j][i+1,j]≤m_d[i+1,j]

(m_k[i+1,j]-m_d[i+1,j]) - (m_k[i,j]-m_d[i,j])

=(m_k[i+1,j]+m_d[i,j]) - (m_d[i+1,j]+m_k[i,j])

=(m[i+1,k]+m[k,j]+m[i,d]+m[d,j]) - (m[i+1,d]+m[d,j]+m[i,k]+m[k,j])

=(m[i+1,k]+m[i,d]) - (m[i+1,d]+m[i,k])

∵m满足四边形不等式，∴对于i<i+1≤k<d有m[i+1,k]+m[i,d]≥m[i+1,d]+m[i,k]

∴(m_k[i+1,j]-m_d[i+1,j])≥(m_k[i,j]-m_d[i,j])≥0

∴s[i,j]≤s[i+1,j]，同理可证s[i,j-1]≤s[i,j]

证毕

扩展：

以上所给出的状态转移方程只是一种比较一般的，其实，很多状态转移方程都满足四边形不等式优化的条件。

解决这类问题的大概步骤是：

0.证明w满足四边形不等式，这里w是m的附属量，形如m[i,j]=opt{m[i,k]+m[k,j]+w[i,j]}，此时大多要先证明w满足条件才能进一步证明m满足条件

1.证明m满足四边形不等式

2.证明s[i,j-1]≤s[i,j]≤s[i+1,j]

pku 1160 Post Office 解题报告

题意: 给出m个村庄及其距离，给出n个邮局，要求怎么建n个邮局使代价最小.

算法:很显然用到动态规划,那么假设:

d[i…n],各邮局的坐标

w[i][j]表示在d[i][j]之间建立一个邮局的村庄为k,则k为i与j之和的一半(很显然在中间建一个邮局距离最小),那么

m[i][j]=min {m[i-1][k]+w[k+1][j]} , (i<=j , i-1<=k<=j-1)

m[i][j]为在前j个村庄建立i个邮局的最小距离和.

那么状态转移方程为:

边界条件: m[1][j]=w[1][j] (1<=j<=m)

状态转移方程: m[i][j]=min {m[i-1][k]+w[k+1][j]} , (i<=j , i-1<=k<=j-1)

那么思路则为:

for i=2 to p do //递推邮局数

{

//m:在前j个村庄建立i个邮局的最小距离和

for j=n dwonto i+1 do //按递减顺序枚举尾指针

m[i][j]=inf;

for k=1 to n do

{

temp = m[i-1][k]+calcw(k+1,j);

if(temp<m[i][j]) m[i][j]=temp;

}

这样时间复杂度显然为O(n^3),这是不能接受的.

仔细分析这dp算法,关键是决策变量k枚举数太多, 联系到四边形不等式原理,w[i][j]与m[i][j]很明显符合四边形不等式,我们假设决策变量s[i][j],如果在1到10的村庄中,建立1个邮局的最佳位置为8,那么在决定见多一个邮局的话,当然是在1到8之间了(根据四边形不等式原理猜想到),所以就在dp的过程中,用s[i][j]记录前i-1个邮局的村庄数. 那么我们第三次搜索的时候,就需要根据决策表s[i-1][j]<=k<=s[i][j+1]的范围内枚举.而可以证明s[i][j]具有单调性,那么我们就可以利用s[i][j]单调性限制了上下界然后把 O(n^3)弄成了 O(n^2)。

以sample为例:

状态方程m:

0 112359213743 2123592127 61235915 1012359 16 21 37 74 117

决策表s:

0 113333788 23355788 3355788 456789 5 6 7 8 9

那么状态转移方程为:

边界条件: m[1][j]=w[1][j] (1<=j<=m)

状态转移方程: m[i][j]= min {m[i-1][k]+w[k+1][j]} , (i<=j , s[i-1][j]<=k<=s[i][j+1])

决策记录表: s[i][j]=k

AC代码:

#include <math.h>#include <stdio.h>#include <stdlib.h>#include <string.h>#define M 305                 //村庄数的上限#define inf 1000000000        //无穷大                                                   long coordinate[M];           //每个村庄的x坐标long dp[M][M];                //dp[i][j]表在在前j个村庄建立i个邮局的最小距离和为dp[i][j];long s[M][M];                 //由s[i][j]记录使用前i-1个邮局的村庄数long euclidean[M][M];         //村庄i与村庄j间的欧式距离为euclidean[i][j]=euclidean[i][j-1]+|coordinate[j]-coordinate[i]|long n, p, answer; int Calculation(long i, long j){       long k;       //可以证明,当仅建立一个邮局时,最优解出现在中位数       k = (i + j) / 2;       return euclidean[k][j] - euclidean[k][i - 1];} int main(){       //freopen("1.txt", "r", stdin);        int i, j, k;       scanf("%ld%ld", &n, &p);       for (i = 1; i <= n; i++)       {              scanf("%ld", &coordinate[i]);       }       memset(euclidean, 0, sizeof(euclidean));       for (i = 1; i <= n; i++)       {              for (j = 1; j <= n; j++)              {                     euclidean[i][j] = euclidean[i][j - 1] + abs(coordinate[j] - coordinate[i]);              }       }       memset(dp, 0, sizeof(dp));       for (i = 1; i <= n; i++)       {              //计算在前i个村庄建立1个邮局的最小距离和              dp[1][i] = Calculation(1, i);       }       for (i = 1; i <= n; i++)       {              //每个村庄建立一个邮局              s[i][i] = i - 1;       }       for (i = 2; i <= p; i++)       {              j = n;              dp[i][j] = inf;              /*在s[i-1][j]到j-1的范围内枚举k值,计算前k个村庄建立一个i-1个邮局、第k+1个村庄~第j个村庄建立一个              邮局的距离和.若该距离为目前最小,则记下方案.*/              //由于决策量s[i][j]的最大值并不包含j=n的情况,所以这里在进行一次dp              for (k = s[i - 1][j]; k <= j - 1; k++)              {                     int temp = dp[i - 1][k] + Calculation(k + 1, j);                     if (temp < dp[i][j])                     {                            dp[i][j] = temp;                            s[i][j] = k;                     }              }              //按递减顺序枚举尾指针              //决策量s[i][j]已经是缩短了搜索的范围              for (j = n - 1; j >= i + 1; j--)              {                     dp[i][j] = inf;                     /*在s[i-1][j]到s[i][j+1]的范围内枚举k值,计算前k个村庄建立一个i-1个邮局、第k+1个村庄~第j个村庄建立一个                     邮局的距离和.若该距离为目前最小,则记下方案.*/                     for (k = s[i - 1][j]; k <= s[i][j + 1]; k++)                     {                            int temp = dp[i - 1][k] + Calculation(k + 1, j);                            if (temp < dp[i][j])                            {                                   dp[i][j] = temp;                                   s[i][j] = k;                            }                     }              }       }       printf("%d/n", dp[p][n]);       return 0;}

参考文献：《新篇实用算法分析与程序设计》