动态规划---矩阵连乘问题

来源：互联网发布：网络词鸡汤编辑：程序博客网时间：2024/06/06 12:48

参考http://blog.csdn.net/liufeng_king/article/details/8497607

问题描述：给定n个矩阵：A1,A2,...,An，其中Ai与Ai+1是可乘的，i=1，2...，n-1。确定计算矩阵连乘积的计算次序，使得依此次序计算矩阵连乘积需要的数乘次数最少。输入数据为矩阵个数和每个矩阵规模，输出结果为计算矩阵连乘积的计算次序和最少数乘次数。

问题解析：由于矩阵乘法满足结合律，故计算矩阵的连乘积可以有许多不同的计算次序。这种计算次序可以用加括号的方式来确定。若一个矩阵连乘积的计算次序完全确定，也就是说该连乘积已完全加括号，则可以依此次序反复调用2个矩阵相乘的标准算法计算出矩阵连乘积。

完全加括号的矩阵连乘积可递归地定义为：

（1）单个矩阵是完全加括号的；

（2）矩阵连乘积A是完全加括号的，则A可表示为2个完全加括号的矩阵连乘积B和C的乘积并加括号，即A=(BC)

例如，矩阵连乘积A1A2A3A4有5种不同的完全加括号的方式：(A1(A2(A3A4)))，(A1((A2A3)A4))，((A1A2)(A3A4))，((A1(A2A3))A4)，(((A1A2)A3)A4)。每一种完全加括号的方式对应于一个矩阵连乘积的计算次序，这决定着作乘积所需要的计算量。

看下面一个例子，计算三个矩阵连乘{A1，A2，A3}；维数分别为10*100 , 100*5 , 5*50 按此顺序计算需要的次数((A1*A2)*A3):10X100X5+10X5X50=7500次，按此顺序计算需要的次数(A1*(A2*A3)):100*5*50+10*100*50=52500次

所以问题是：如何确定运算顺序，可以使计算量达到最小化。

动态规划算法思路：

例：设要计算矩阵连乘乘积A1A2A3A4A5A6，其中各矩阵的维数分别是：

A1：30*35; A2：35*15; A3：15*5; A4：5*10; A5：10*20; A6：20*25

a.分析最优解的结构

将矩阵连乘积AiAi+1...Aj记为A[i:j]。考察计算A[1:n]计算次序。设计算次序在矩阵Ak和Ak+1之间断开，1<=k<n，则其相应的完全加括号方式为((A1...Ak)(Ak+1...An))。依此次序，先计算A[1:k]和A[k+1:n]，再将计算结果相乘得到A[1:n]，依此计算次序总计算量为A[1:k]的计算量加上A[k+1:n]的计算量，再加上A[1:k]和A[k+1:n]相乘的计算量。

计算A[1:n]的最优次序所包括的计算矩阵子链A[1:k]和A[k+1:n]的次序也是最优的。事实上，若有一个计算A[1:k]的次序需要的计算量更少，，则用此次序替换原来的计算A[1:k]的次序，得到的计算量将比最优次序所需计算量更少，这是一个矛盾。同理，计算A[1:n]的最优次序所包含的计算矩阵字链A[k+1:n]的次序也是最优的。（最优子结构性质）

b.建立递推关系

设计算A[i:j]，1≤i≤j≤n，所需要的最少数乘次数m[i,j]，则原问题的最优值为m[1,n]。

当i=j时，A[i:j]=Ai，因此，m[i][i]=0，i=1,2,…,n
当i<j时，若A[i:j]的最优次序在Ak和Ak+1之间断开，i<=k<j,则：m[i][j]=m[i][k]+m[k+1][j]+pi-1pkpj。由于在计算时并不知道断开点k的位置，所以k还未定。不过k的位置只有j-i个可能。因此，k是这j-i个位置使计算量达到最小的那个位置。

综上，有递推关系如下：

将对应于m[i][j]的断开位置k记为s[i][j]，在计算出最优值m[i][j]后，可以递归地由s[i][j]构造出最优解。

c.计算最优值：

依据上面递归式以自底向上方式计算。计算过程中保存已解决的子问题的答案。每个子问题只计算一次，后面需要时只需检查下，从而避免大量重复计算。

输入参数{p0,p1,...pn}存储于数组p中,最优值数组m，数组s记录最优断开位置

void MatrixChapin(int *p,int n,int **m,int **s)  {      for(int i=1; i<=n; i++) m[i][i] = 0;      for(int r=2; r<=n; r++) //r为当前计算的链长（子问题规模）        {          for(int i=1; i<=n-r+1; i++)//n-r+1为最后一个r链的前边界            {              int j = i+r-1;//计算前边界为r，链长为r的链的后边界                  m[i][j] = m[i+1][j] + p[i-1]*p[i]*p[j];//将链ij划分为A(i) * ( A[i+1:j] )                 s[i][j] = i;                for(int k=i+1; k<j; k++)              {                  //将链ij划分为( A[i:k] )* (A[k+1:j])，i+1<=k<j                     int t = m[i][k] + m[k+1][j] + p[i-1]*p[k]*p[j];                  if(t<m[i][j])                  {                      m[i][j] = t;                      s[i][j] = k;                  }              }          }      }  }

以上算法首先计算出m[i][i]=0,i=1,2,...,n，然后根据递归式，按矩阵链长递增的方式依次计算m[i][i+1],i=1,2,...,n-1（矩阵链长度为2）；m[i][i+2],i=1,2,...,n-2（矩阵链长度为3）；...。计算m[i][j]时只用到已经计算出的m[i][k]和m[k+1][j]。

d.构造最优解：

若将对应m[i][j]的断开位置k记为s[i][j]，在计算出最优值m[i][j]后，可递归地由s[i][j]构造出相应的最优解。s[i][j]中的数表明，计算矩阵链A[i:j]的最佳方式应在矩阵Ak和Ak+1之间断开，即最优的加括号方式应为(A[i:k])(A[k+1:j)。因此，从s[1][n]记录的信息可知计算A[1:n]的最优加括号方式为(A[1:s[1][n]])(A[s[1][n]+1:n])，进一步递推，A[1:s[1][n]]的最优加括号方式为(A[1:s[1][s[1][n]]])(A[s[1][s[1][n]]+1:s[1][s[1][n]]])。同理可以确定A[s[1][n]+1:n]的最优加括号方式在s[s[1][n]+1][n]处断开...照此递推下去，最终可以确定A[1:n]的最优完全加括号方式，及构造出问题的一个最优解。

void Traceback(int i,int j,int **s)  {      if(i==j) return;      Traceback(i,s[i][j],s);      Traceback(s[i][j]+1,j,s);      cout<<"Multiply A"<<i<<","<<s[i][j];      cout<<" and A"<<(s[i][j]+1)<<","<<j<<endl;  }

要输出A[1:n]的最优计算次序只要调用Traceback(1,n,s)即可。

1、穷举法

列举出所有可能的计算次序，并计算出每一种计算次序相应需要的数乘次数，从中找出一种数乘次数最少的计算次序。

对于n个矩阵的连乘积，设其不同的计算次序为P(n)。每种加括号方式都可以分解为两个子矩阵的加括号问题：(A1...Ak)(Ak+1…An)可以得到关于P(n)的递推式如下：

以上递推关系说明，P(n)是随n的增长呈指数增长的。因此，穷举法不是一个多项式时间复杂度算法。

2、重叠递归

从以上递推关系和构造最优解思路出发，即可写出有子问题重叠性的递归代码实现：

#include <stdio.h>#include <iostream>#include <fstream>#include <string.h>using namespace std;const int L = 7;int RecurMatrixChain(int i,int j,int **s,int *p);//递归求最优解void Traceback(int i,int j,int **s);//构造最优解int main(){    int p[L]={30,35,15,5,10,20,25};//矩阵A1...A6    int **s = new int *[L];    for(int i=0;i<L;i++)        s[i] = new int[L];    cout<<"矩阵的最少计算次数为："<<RecurMatrixChain(1,6,s,p)<<endl;    cout<<"矩阵最优计算次序为："<<endl;    Traceback(1,6,s);    return 0;}int RecurMatrixChain(int i,int j,int **s,int *p){    if(i==j) return 0;    int u = RecurMatrixChain(i,i,s,p)+RecurMatrixChain(i+1,j,s,p)+p[i-1]*p[i]*p[j];    s[i][j] = i;    for(int k=i+1; k<j; k++)    {        int t = RecurMatrixChain(i,k,s,p) + RecurMatrixChain(k+1,j,s,p) + p[i-1]*p[k]*p[j];        if(t<u)        {            u=t;            s[i][j]=k;        }    }    return u;}void Traceback(int i,int j,int **s){    if(i==j) return;    Traceback(i,s[i][j],s);    Traceback(s[i][j]+1,j,s);    cout<<"Multiply A"<<i<<","<<s[i][j];    cout<<" and A"<<(s[i][j]+1)<<","<<j<<endl;}

代码中矩阵A[1:6]，6个矩阵连乘
用算法RecurMatrixChain(1,4,s,p)计算a[1:4]的计算递归树如下图所示：

从上图可以看出很多子问题被重复运算。可以证明，该算法的计算时间T(n)有指数下界。设算法中判断语句和赋值

语句为常数时间，则由算法的递归部分可得关于T(n)的递归不等式：

用数学归纳法可以证明，因此，算法RecurMatrixChain的计算时间也随n指数增长。

3、备忘录递归算法

备忘录方法用表格保存已解决的子问题答案，在下次需要解决此子问题时，只要简单查看该子问题的解答，而不必

重新计算。备忘录方法为每一个子问题建立一个记录项，初始化时，该记录项存入一个特殊的值，表示该子问题尚未

求解。在求解的过程中，对每个带求的子问题，首先查看其相应的记录项。若记录项中存储的是初始化时存入的特殊

值，则表示该问题是第一次遇到，此时计算出该子问题的解，并将其保存在相应的记录项中，以备以后查看。若记录

项中存储的已不是初始化时存入的特殊值，则表示该子问题已被计算过，相应的记录项中存储的是该子问题的解答。

此时从记录项中取出该子问题的解答即可，而不必重新计算。

#include <stdio.h>#include <iostream>#include <fstream>#include <string.h>using namespace std;const int L = 7;int LookupChain(int i,int j,int **m,int **s,int *p);int MemoizedMatrixChain(int n,int **m,int **s,int *p);void Traceback(int i,int j,int **s);//构造最优解int main(){    int p[L]={30,35,15,5,10,20,25};    int **s = new int *[L];    int **m = new int *[L];    for(int i=0;i<L;i++)    {        s[i] = new int[L];        m[i] = new int[L];    }    cout<<"矩阵的最少计算次数为："<<MemoizedMatrixChain(6,m,s,p)<<endl;    cout<<"矩阵最优计算次序为："<<endl;    Traceback(1,6,s);    return 0;}int MemoizedMatrixChain(int n,int **m,int **s,int *p){    for(int i=1; i<=n; i++)    {        for(int j=1; j<=n; j++)            m[i][j]=0;    }    return LookupChain(1,n,m,s,p);}int LookupChain(int i,int j,int **m,int **s,int *p){    if(m[i][j]>0)        return m[i][j];    if(i==j)        return 0;    int u = LookupChain(i,i,m,s,p) + LookupChain(i+1,j,m,s,p)+p[i-1]*p[i]*p[j];    s[i][j]=i;    for(int k=i+1; k<j; k++)    {        int t = LookupChain(i,k,m,s,p) + LookupChain(k+1,j,m,s,p) + p[i-1]*p[k]*p[j];        if(t<u)        {            u=t;            s[i][j] = k;        }    }    m[i][j] = u;    return u;}void Traceback(int i,int j,int **s){    if(i==j) return;    Traceback(i,s[i][j],s);    Traceback(s[i][j]+1,j,s);    cout<<"Multiply A"<<i<<","<<s[i][j];    cout<<" and A"<<(s[i][j]+1)<<","<<j<<endl;}

与动态规划算法一样，算法通过数组m记录子问题的最优值，m初始化为0，表明相应的子问题还没有被计算。在调用

LookupChain时，若m[i][j]>0，则表示其中存储的是所要求子问题的计算结果，直接返回即可。否则与直接递归算法

一样递归计算，并将计算结果存入m[i][j]中返回。备忘录算法耗时O(n^3)，将直接递归算法的计算时间从2^n降至

O(n^3)。

4.动态规划方法

用动态规划迭代方式解决此问题，可依据其递归式自底向上的方式进行计算。在计算过程中，保存已解决的子问题的

答案。每个子问题只计算一次，而在后面需要时只需简单检查一下，从而避免了大量的重复计算，最终得到多项式时

间的算法。

#include <stdio.h>#include <iostream>#include <fstream>#include <string.h>using namespace std;const int L = 7;int MatrixChain(int n,int **m,int **s,int *p);void Traceback(int i,int j,int **s);//构造最优解int main(){    int p[L]={30,35,15,5,10,20,25};    int **s = new int *[L];    int **m = new int *[L];    for(int i=0;i<L;i++)    {        s[i] = new int[L];        m[i] = new int[L];    }    cout<<"矩阵的最少计算次数为："<<MatrixChain(6,m,s,p)<<endl;    cout<<"矩阵最优计算次序为："<<endl;    Traceback(1,6,s);    return 0;}int MatrixChain(int n,int **m,int **s,int *p){    for(int i=1; i<=n; i++)        m[i][i] = 0;    for(int r=2; r<=n; r++) //r为当前计算的链长（子问题规模）    {        for(int i=1; i<=n-r+1; i++)//n-r+1为最后一个r链的前边界        {            int j = i+r-1;//计算前边界为r，链长为r的链的后边界            m[i][j] = m[i+1][j] + p[i-1]*p[i]*p[j];//将链ij划分为A(i) * ( A[i+1:j] )            s[i][j] = i;            for(int k=i+1; k<j; k++)            {                //将链ij划分为( A[i:k] )* (A[k+1:j])                int t = m[i][k] + m[k+1][j] + p[i-1]*p[k]*p[j];                if(t<m[i][j])                {                    m[i][j] = t;                    s[i][j] = k;                }            }        }    }    return m[1][L-1];}void Traceback(int i,int j,int **s){    if(i==j) return;    Traceback(i,s[i][j],s);    Traceback(s[i][j]+1,j,s);    cout<<"Multiply A"<<i<<","<<s[i][j];    cout<<" and A"<<(s[i][j]+1)<<","<<j<<endl;}

上述迭代算法的运行过程如下图所示：