求最短路径算法之Floyd算法

来源:互联网 发布:刘琨 祖逖 知乎 编辑:程序博客网 时间:2024/05/21 17:15

        在网上寻找了一些Floyd资料,觉得这篇挺好的,符合动态规划的解析,又能够把Floyd算法表述清晰,就记录下来,添加自己的理解,留作后用。参考:http://leon.cc.blogbus.com/logs/3629782.html

       对于没有学过Floyd的人来说,在掌握了Dijkstra之后遇到All-Pairs最短路径问题的第一反应可能会是:计算所有点的单源点最短路径,不就可以得到所有点的最短路径了吗。简单得描述一下算法就是执行n次Dijkstra算法。

       Floyd可以说是Warshall算法的扩展了,三个for循环便可以解决一个复杂的问题,应该说是十分经典的。从它的三层循环可以看出,它的复杂度是n^3,除了在第二层for中加点判断可以略微提高效率,几乎没有其他办法再减少它的复杂度。

       比较两种算法,不难得出以下的结论:对于稀疏的图,采用n次Dijkstra比较出色,对于茂密的图,可以使用Floyd算法。另外,Floyd可以处理带负边的图。

       下面对Floyd算法进行介绍:

        Floyd算法的基本思想:

        可以将问题分解,先找出最短的距离,然后在考虑如何找出对应的行进路线。如何找出最短路径呢,这里还是用到动态规划的知识,对于任何一个城市而言,i到j的最短距离不外乎存在经过i与j之间的k和不经过k两种可能(这种思路比较常见,动态规划的基本假设,也是形成深搜+递归思想、贪心细想的基础),所以可以令k=1,2,3,...,n(n是城市的数目),在检查d(ij)与d(ik)+d(kj)的值;在此d(ik)与d(kj)分别是目前为止所知道的i到k与k到j的最短距离,因此d(ik)+d(kj)就是i到j经过k的最短距离。所以,若有d(ij)>d(ik)+d(kj),就表示从i出发经过k再到j的距离要比原来的i到j距离短,自然把i到j的d(ij)重写为d(ik)+d(kj),每当一个k查完了,d(ij)就是目前的i到j的最短距离。重复这一过程,最后当查完所有的k时,d(ij)里面存放的就是i到j之间的最短距离了。(每一步,k值逐渐递增,矩阵扩张式地更新,用之前得到的最短距离有策略地更新最短距离【抛弃k点,或者加入k点到路径中】)

    Floyd算法的基本步骤:

    定义n×n的方阵序列D-1, D0 , … Dn-1,

初始化: D-1=C

    D-1[i][j]=边<i,j>的长度,表示初始的从i到j的最短路径长度,即它是从i到j的中间不经过其他中间点的最短路径。

迭代:设Dk-1已求出,如何得到Dk(0≤k≤n-1)?

    Dk-1[i][j]表示从i到j的中间点不大于k-1的最短路径p:i…j,

    考虑将顶点k加入路径p得到顶点序列q:i…k…j,

    若q不是路径,则当前的最短路径仍是上一步结果:Dk[i][j]= Dk-1[i][j];

    否则若q的长度小于p的长度,则用q取代p作为从i到j的最短路径。

    因为q的两条子路径i…k和k…j皆是中间点不大于k-1的最短路径,所以从i到j中间点不大于k的最短路径长度为:

    Dk[i][j]=min{ Dk-1[i][j], Dk-1[i][k]+Dk-1[k][j] }

  Floyd算法实现:
    可以用三个for循环把问题搞定了,但是有一个问题需要注意,那就是for循环的嵌套的顺序:我们可能随手就会写出这样的程序,但是仔细考虑的话,会发现是有问题的。
                    for(int i=0; i<n; i++)
                          for(int j=0; j<n; j++)
                               for(int k=0; k<n; k++)  
   

     问题出在我们太早的把i-k-j的距离确定下来了,假设一旦找到了i-p-j最短的距离后,i到j就相当处理完了,以后不会在改变了,一旦以后有使i到j的更短的距离时也不能再去更新了,所以结果一定是不对的。所以应当象下面一样来写程序:

                   for(int k=0; k<n; k++)
                        for(int i=0; i<n; i++)
                             for(int j=0; j<n; j++)

   这样作的意义在于固定了k,把所有i到j而经过k的距离找出来,然后象开头所提到的那样进行比较和重写,因为k是在最外层的,所以会把所有的i到j都处理完后,才会移动到下一个k,这样就不会有问题了,看来多层循环的时候,我们一定要当心,否则很容易就弄错了。
     接下来就要看一看如何找出最短路径所行经的城市了,这里要用到另一个矩阵P,它的定义是这样的:p(ij)的值如果为p,就表示i到j的最短行经为i->...->p->j,也就是说p是i到j的最短行径中的j之前的最后一个城市。P矩阵的初值为p(ij)=i。有了这个矩阵之后,要找最短路径就轻而易举了。对于i到j而言找出p(ij),令为p,就知道了路径i->...->p->j;再去找p(ip),如果值为q,i到p的最短路径为i->...->q->p;再去找p(iq),如果值为r,i到q的最短路径为i->...->r->q;所以一再反复,到了某个p(it)的值为i时,就表示i到t的最短路径为i->t,就会的到答案了,i到j的最短行径为i->t->...->q->p->j。因为上述的算法是从终点到起点的顺序找出来的,所以输出的时候要把它倒过来。

     但是,如何动态的回填P矩阵的值呢?回想一下,当d(ij)>d(ik)+d(kj)时,就要让i到j的最短路径改为走i->...->k->...->j这一条路,但是d(kj)的值是已知的,换句话说,就是k->...->j这条路是已知的,所以k->...->j这条路上j的上一个城市(即p(kj))也是已知的,当然,因为要改走i->...->k->...->j这一条路,j的上一个城市正好是p(kj)。所以一旦发现d(ij)>d(ik)+d(kj),就把p(kj)存入p(ij)。(实际上,就是不断记录该最小路径终点的前一个顶点是谁,更新时,若该最小路径经过k点,则该路径的先前顶点中一定包含从i到k点最短路径的先前顶点,更新之。输出时,不断寻找先前顶点,反序输出即为路径)

     下面为网上的一个测试程序,直接摘抄:

下面是具体的C代码:
   #include <stdio.h>           
   #include <limits.h>         
   #include <stdlib.h>          
   #define   MAXSIZE  20      

   void  floyd(int[][MAXSIZE], int [][MAXSIZE], int);
   void  display_path(int [][MAXSIZE], int [][MAXSIZE], int);
   void  reverse(int [], int);
   void  readin(int [][MAXSIZE], int *);

   #define   MAXSUM(a,b)   (((a) != INT_MAX && (b) != INT_MAX) ? \
                         ((a) + (b)) : INT_MAX)

   void floyd(int dist[][MAXSIZE],int path[][MAXSIZE], int n)
   {
       int  i, j, k;
       for (i = 0; i < n; i++)
           for (j = 0; j <n; j++)
              path[i][j] = i;
       for (k = 0; k < n; k++)
           for (i = 0; i <n; i++)
              for (j = 0; j < n; j++)
                   if (dist[i][j] > MAXSUM(dist[i][k], dist[k][j]))
                   {
                        path[i][j] = path[k][j];
                        dist[i][j] = MAXSUM(dist[i][k], dist[k][j]);
                   }
   }

   void display_path(intdist[][MAXSIZE], int path[][MAXSIZE], int n)
   {
       int  *chain;
       int  count;
       int  i, j, k;
      printf("\n\nOrigin->Dest   Dist   Path");
       printf( "\n-----------------------------");
       chain = (int *) malloc(sizeof(int)*n);
       for (i = 0; i < n; i++)
           for (j = 0; j <n; j++)
           {
              if (i != j)
              {
                   printf("\n%6d->%d    ", i+1, j+1);
                   if (dist[i][j] == INT_MAX)
                        printf("  NA    ");
                   else
                   {
                        printf("%4d    ", dist[i][j]);
                        count = 0; 
                        k = j;
                        do
                        {
                            k = chain[count++] = path[i][k];
                        } while (i != k);
                        reverse(chain, count);
                        printf("%d", chain[0]+1);
                        for (k = 1; k < count; k++)
                             printf("->%d", chain[k]+1);
                        printf("->%d", j+1);
                   }
              }
           }
      free(chain);           
   }

   #define SWAP(a, b)  {temp = a; a = b; b = temp; }

   void reverse(int x[], int n)
   {
       int  i, j, temp;
       for (i = 0, j = n-1; i < j; i++, j--)
            SWAP(x[i],x[j]);
   }

   void readin(intdist[][MAXSIZE], int *number)
   {
       int  origin, dest, length, n;
       int  i, j;
       char line[100];
      gets(line);            
       sscanf(line, "%d", &n);
       *number = n;
       for (i = 0; i < n; i++)
       {
           for (j = 0; j <n; j++)
               dist[i][j] = INT_MAX;
           dist[i][i] =0;   
       }
       gets(line);            
       sscanf(line, "%d%d%d",&origin, &dest, &length);
       while (origin != 0 && dest != 0&& length != 0)
       {
          dist[origin-1][dest-1] =length;
         gets(line);       
          sscanf(line,"%d%d%d", &origin, &dest, &length);
       }
   }
    /// 测试程序如下所示:
   int main(void)
   {
       int dist[MAXSIZE][MAXSIZE];
       int path[MAXSIZE][MAXSIZE];
       int n;
       printf("\nInput the pathinformation:");
      printf("\n----------------------------\n");
       readin(dist, &n);
       floyd(dist, path, n);
       display_path(dist, path, n);
       getchar();
   }
     其中readin函数规定了输入的格式,第一列是指出有多少个城市;第二列以后每行三个数;第一个和第二个是一条路径的起点和终点,第三个数是路径的长度,最后以三个0作为输入结束条件。下面是一个输入的例子:
             Input the path information:
           --------------------------------------
             4
             1         2          5
             2         1          50
             2         3          15
             2         4          5
             3         1          30
             3         4          15
             4         1          15
             4         3          5
             0         0          0
   对应的输出结果为:
     Origin->Dest     Dist          Path
  ----------------------------------------------
       1->2            5          1->2
       1->3           15          1->2->4->3
       1->4           10          1->2->4
       2->1           20          2->4->1
       2->3           10          2->4->3
       2->4            5          2->4
       3->1           30          3->1
       3->2           35          3->1->2
       3->4           15          3->4
       4->1           15          4->1
       4->2           20          4->1->2
       4->3            5          4->3