strassen矩阵乘法算法

来源:互联网 发布:诺基亚java手机qq 编辑:程序博客网 时间:2024/04/25 22:09
Strassen矩阵乘法是通过递归实现的,它将一般情况下二阶矩阵乘法(可扩展到n阶,但Strassen矩阵乘法要求n是2的幂)所需的8次乘法降低为7次,将计算时间从O(nE3)降低为O(nE2.81)。


矩阵C = AB,可写为
C11 = A11B11 + A12B21
C12 = A11B12 + A12B22
C21 = A21B11 + A22B21
C22 = A21B12 + A22B22
如果A、B、C都是二阶矩阵,则共需要8次乘法和4次加法。如果阶大于2,可以将矩阵分块进行计算。耗费的时间是O(nE3)。


要改进算法计算时间的复杂度,必须减少乘法运算次数。按分治法的思想,Strassen提出一种新的方法,用7次乘法完成2阶矩阵的乘法,算法如下:
M1 = A11(B12 - B12)
M2 = (A11 + A12)B22
M3 = (A21 + A22)B11
M4 = A22(B21 - B11)
M5 = (A11 + A22)(B11 + B22)
M6 = (A12 - A22)(B21 + B22)
M7 = (A11 - A21)(B11 + B12)
完成了7次乘法,再做如下加法:
C11 = M5 + M4 - M2 + M6
C12 = M1 + M2
C21 = M3 + M4
C22 = M5 + M1 - M3 - M7
全部计算使用了7次乘法和18次加减法,计算时间降低到O(nE2.81)。计算复杂性得到较大改进。


附Strassen矩阵乘法代码:
//STRASSEN矩阵乘法算法#include <iostream.h>const int N=4; //常量N用来定义矩阵的大小void main(){    void STRASSEN(int n,float A[][N],float B[][N],float C[][N]);    void input(int n,float p[][N]);    void output(int n,float C[][N]);                    //函数声明部分    float A[N][N],B[N][N],C[N][N];  //定义三个矩阵A,B,C    cout<<"现在录入矩阵A[N][N]:"<<endl<<endl;    input(N,A);    cout<<endl<<"现在录入矩阵B[N][N]:"<<endl<<endl;    input(N,B);                         //录入数组    STRASSEN(N,A,B,C);   //调用STRASSEN函数计算    output(N,C);  //输出计算结果}void input(int n,float p[][N])  //矩阵输入函数{    int i,j;    for(i=0;i<n;i++)    {        cout<<"请输入第"<<i+1<<"行"<<endl;        for(j=0;j<n;j++)            cin>>p[i][j];    }}void output(int n,float C[][N]) //据矩阵输出函数{    int i,j;    cout<<"输出矩阵:"<<endl;    for(i=0;i<n;i++)    {        cout<<endl;        for(j=0;j<n;j++)            cout<<C[i][j]<<"  ";    }    cout<<endl<<endl;}void MATRIX_MULTIPLY(float A[][N],float B[][N],float C[][N])  //按通常的矩阵乘法计算C=AB的子算法(仅做2阶){    int i,j,t;    for(i=0;i<2;i++)                     //计算A*B-->C        for(j=0;j<2;j++)        {                C[i][j]=0;                   //计算完一个C[i][j],C[i][j]应重新赋值为零            for(t=0;t<2;t++)            C[i][j]=C[i][j]+A[i][t]*B[t][j];        }}void MATRIX_ADD(int n,float X[][N],float Y[][N],float Z[][N]) //矩阵加法函数X+Y—>Z{    int i,j;    for(i=0;i<n;i++)        for(j=0;j<n;j++)            Z[i][j]=X[i][j]+Y[i][j];}void MATRIX_SUB(int n,float X[][N],float Y[][N],float Z[][N]) //矩阵减法函数X-Y—>Z{    int i,j;    for(i=0;i<n;i++)        for(j=0;j<n;j++)            Z[i][j]=X[i][j]-Y[i][j];}void STRASSEN(int n,float A[][N],float B[][N],float C[][N])  //STRASSEN函数(递归){    float A11[N][N],A12[N][N],A21[N][N],A22[N][N];    float B11[N][N],B12[N][N],B21[N][N],B22[N][N];    float C11[N][N],C12[N][N],C21[N][N],C22[N][N];    float M1[N][N],M2[N][N],M3[N][N],M4[N][N],M5[N][N],M6[N][N],M7[N][N];    float AA[N][N],BB[N][N],MM1[N][N],MM2[N][N];    int i,j;//,x;    if (n==2)        MATRIX_MULTIPLY(A,B,C);//按通常的矩阵乘法计算C=AB的子算法(仅做2阶)    else    {        for(i=0;i<n/2;i++)                          for(j=0;j<n/2;j++)                {                    A11[i][j]=A[i][j];                    A12[i][j]=A[i][j+n/2];                    A21[i][j]=A[i+n/2][j];                    A22[i][j]=A[i+n/2][j+n/2];                    B11[i][j]=B[i][j];                    B12[i][j]=B[i][j+n/2];                    B21[i][j]=B[i+n/2][j];                    B22[i][j]=B[i+n/2][j+n/2];                }       //将矩阵A和B式分为四块    MATRIX_SUB(n/2,B12,B22,BB);              STRASSEN(n/2,A11,BB,M1);//M1=A11(B12-B22)    MATRIX_ADD(n/2,A11,A12,AA);    STRASSEN(n/2,AA,B22,M2);//M2=(A11+A12)B22    MATRIX_ADD(n/2,A21,A22,AA);    STRASSEN(n/2,AA,B11,M3);//M3=(A21+A22)B11    MATRIX_SUB(n/2,B21,B11,BB);    STRASSEN(n/2,A22,BB,M4);//M4=A22(B21-B11)    MATRIX_ADD(n/2,A11,A22,AA);    MATRIX_ADD(n/2,B11,B22,BB);    STRASSEN(n/2,AA,BB,M5);//M5=(A11+A22)(B11+B22)    MATRIX_SUB(n/2,A12,A22,AA);    MATRIX_SUB(n/2,B21,B22,BB);    STRASSEN(n/2,AA,BB,M6);//M6=(A12-A22)(B21+B22)    MATRIX_SUB(n/2,A11,A21,AA);    MATRIX_SUB(n/2,B11,B12,BB);    STRASSEN(n/2,AA,BB,M7);//M7=(A11-A21)(B11+B12)    //计算M1,M2,M3,M4,M5,M6,M7(递归部分)    MATRIX_ADD(N/2,M5,M4,MM1);                    MATRIX_SUB(N/2,M2,M6,MM2);    MATRIX_SUB(N/2,MM1,MM2,C11);//C11=M5+M4-M2+M6    MATRIX_ADD(N/2,M1,M2,C12);//C12=M1+M2    MATRIX_ADD(N/2,M3,M4,C21);//C21=M3+M4    MATRIX_ADD(N/2,M5,M1,MM1);    MATRIX_ADD(N/2,M3,M7,MM2);    MATRIX_SUB(N/2,MM1,MM2,C22);//C22=M5+M1-M3-M7    for(i=0;i<n/2;i++)        for(j=0;j<n/2;j++)        {            C[i][j]=C11[i][j];            C[i][j+n/2]=C12[i][j];            C[i+n/2][j]=C21[i][j];            C[i+n/2][j+n/2]=C22[i][j];        }                                            //计算结果送回C[N][N]    }}






0 0
原创粉丝点击