求最短路径算法之Floyd算法

来源：互联网发布：刘琨祖逖知乎编辑：程序博客网时间：2024/05/21 17:15

在网上寻找了一些Floyd资料，觉得这篇挺好的，符合动态规划的解析，又能够把Floyd算法表述清晰，就记录下来，添加自己的理解，留作后用。参考：http://leon.cc.blogbus.com/logs/3629782.html

对于没有学过Floyd的人来说，在掌握了Dijkstra之后遇到All-Pairs最短路径问题的第一反应可能会是：计算所有点的单源点最短路径，不就可以得到所有点的最短路径了吗。简单得描述一下算法就是执行n次Dijkstra算法。

Floyd可以说是Warshall算法的扩展了，三个for循环便可以解决一个复杂的问题，应该说是十分经典的。从它的三层循环可以看出，它的复杂度是n^3，除了在第二层for中加点判断可以略微提高效率，几乎没有其他办法再减少它的复杂度。

比较两种算法，不难得出以下的结论：对于稀疏的图，采用n次Dijkstra比较出色，对于茂密的图，可以使用Floyd算法。另外，Floyd可以处理带负边的图。

下面对Floyd算法进行介绍：

Floyd算法的基本思想：

可以将问题分解，先找出最短的距离，然后在考虑如何找出对应的行进路线。如何找出最短路径呢，这里还是用到动态规划的知识，对于任何一个城市而言，i到j的最短距离不外乎存在经过i与j之间的k和不经过k两种可能(这种思路比较常见，动态规划的基本假设，也是形成深搜+递归思想、贪心细想的基础)，所以可以令k=1，2，3，...，n(n是城市的数目)，在检查d(ij)与d(ik)+d(kj)的值；在此d(ik)与d(kj)分别是目前为止所知道的i到k与k到j的最短距离，因此d(ik)+d(kj)就是i到j经过k的最短距离。所以，若有d(ij)>d(ik)+d(kj)，就表示从i出发经过k再到j的距离要比原来的i到j距离短，自然把i到j的d(ij)重写为d(ik)+d(kj)，每当一个k查完了，d(ij)就是目前的i到j的最短距离。重复这一过程，最后当查完所有的k时，d(ij)里面存放的就是i到j之间的最短距离了。（每一步，k值逐渐递增，矩阵扩张式地更新，用之前得到的最短距离有策略地更新最短距离【抛弃k点，或者加入k点到路径中】）

Floyd算法的基本步骤：

定义n×n的方阵序列D-1, D0 , … Dn－1,

初始化： D-1＝C

D-1[i][j]＝边<i,j>的长度，表示初始的从i到j的最短路径长度，即它是从i到j的中间不经过其他中间点的最短路径。

迭代：设Dk-1已求出，如何得到Dk（0≤k≤n-1）？

Dk-1[i][j]表示从i到j的中间点不大于k-1的最短路径p：i…j，

考虑将顶点k加入路径p得到顶点序列q：i…k…j，

若q不是路径，则当前的最短路径仍是上一步结果：Dk[i][j]= Dk－1[i][j]；

否则若q的长度小于p的长度，则用q取代p作为从i到j的最短路径。

因为q的两条子路径i…k和k…j皆是中间点不大于k－1的最短路径，所以从i到j中间点不大于k的最短路径长度为：

Dk[i][j]＝min{ Dk-1[i][j], Dk-1[i][k]+Dk-1[k][j] }

Floyd算法实现：
    可以用三个for循环把问题搞定了，但是有一个问题需要注意，那就是for循环的嵌套的顺序：我们可能随手就会写出这样的程序，但是仔细考虑的话，会发现是有问题的。
                    for(int i=0; i<n; i++)
                          for(int j=0; j<n; j++)
                               for(int k=0; k<n; k++)

问题出在我们太早的把i-k-j的距离确定下来了，假设一旦找到了i-p-j最短的距离后，i到j就相当处理完了，以后不会在改变了，一旦以后有使i到j的更短的距离时也不能再去更新了，所以结果一定是不对的。所以应当象下面一样来写程序：

                   for(int k=0; k<n; k++)
                        for(int i=0; i<n; i++)
                             for(int j=0; j<n; j++)

这样作的意义在于固定了k，把所有i到j而经过k的距离找出来，然后象开头所提到的那样进行比较和重写，因为k是在最外层的，所以会把所有的i到j都处理完后，才会移动到下一个k，这样就不会有问题了，看来多层循环的时候，我们一定要当心，否则很容易就弄错了。
接下来就要看一看如何找出最短路径所行经的城市了，这里要用到另一个矩阵P，它的定义是这样的：p(ij)的值如果为p，就表示i到j的最短行经为i->...->p->j，也就是说p是i到j的最短行径中的j之前的最后一个城市。P矩阵的初值为p(ij)=i。有了这个矩阵之后，要找最短路径就轻而易举了。对于i到j而言找出p(ij)，令为p，就知道了路径i->...->p->j；再去找p(ip)，如果值为q，i到p的最短路径为i->...->q->p；再去找p(iq)，如果值为r，i到q的最短路径为i->...->r->q；所以一再反复，到了某个p(it)的值为i时，就表示i到t的最短路径为i->t，就会的到答案了，i到j的最短行径为i->t->...->q->p->j。因为上述的算法是从终点到起点的顺序找出来的，所以输出的时候要把它倒过来。

但是，如何动态的回填P矩阵的值呢？回想一下，当d(ij)>d(ik)+d(kj)时，就要让i到j的最短路径改为走i->...->k->...->j这一条路，但是d(kj)的值是已知的，换句话说，就是k->...->j这条路是已知的，所以k->...->j这条路上j的上一个城市(即p(kj))也是已知的，当然，因为要改走i->...->k->...->j这一条路，j的上一个城市正好是p(kj)。所以一旦发现d(ij)>d(ik)+d(kj)，就把p(kj)存入p(ij)。（实际上，就是不断记录该最小路径终点的前一个顶点是谁，更新时，若该最小路径经过k点，则该路径的先前顶点中一定包含从i到k点最短路径的先前顶点，更新之。输出时，不断寻找先前顶点，反序输出即为路径）

下面为网上的一个测试程序，直接摘抄：

下面是具体的C代码：
   #include <stdio.h>
   #include <limits.h>
   #include <stdlib.h>
   #define   MAXSIZE  20

   void floyd(int[][MAXSIZE], int [][MAXSIZE], int);
   void display_path(int [][MAXSIZE], int [][MAXSIZE], int);
   void reverse(int [], int);
   void readin(int [][MAXSIZE], int *);

#define MAXSUM(a,b) (((a) != INT_MAX && (b) != INT_MAX) ? \
((a) + (b)) : INT_MAX)

   void floyd(int dist[][MAXSIZE],int path[][MAXSIZE], int n)
   {
       int i, j, k;
       for (i = 0; i < n; i++)
           for (j = 0; j <n; j++)
              path[i][j] = i;
       for (k = 0; k < n; k++)
           for (i = 0; i <n; i++)
              for (j = 0; j < n; j++)
                   if (dist[i][j] > MAXSUM(dist[i][k], dist[k][j]))
                   {
                        path[i][j] = path[k][j];
                        dist[i][j] = MAXSUM(dist[i][k], dist[k][j]);
                   }
   }

   void display_path(intdist[][MAXSIZE], int path[][MAXSIZE], int n)
   {
       int *chain;
       int count;
       int i, j, k;
      printf("\n\nOrigin->Dest   Dist   Path");
       printf( "\n-----------------------------");
       chain = (int *) malloc(sizeof(int)*n);
       for (i = 0; i < n; i++)
           for (j = 0; j <n; j++)
           {
              if (i != j)
              {
                   printf("\n%6d->%d    ", i+1, j+1);
                   if (dist[i][j] == INT_MAX)
                        printf(" NA    ");
                   else
                   {
                        printf("%4d    ", dist[i][j]);
                        count = 0;
                        k = j;
                        do
                        {
                            k = chain[count++] = path[i][k];
                        } while (i != k);
                        reverse(chain, count);
                        printf("%d", chain[0]+1);
                        for (k = 1; k < count; k++)
                             printf("->%d", chain[k]+1);
                        printf("->%d", j+1);
                   }
              }
           }
      free(chain);
   }

#define SWAP(a, b) {temp = a; a = b; b = temp; }

   void reverse(int x[], int n)
   {
       int i, j, temp;
       for (i = 0, j = n-1; i < j; i++, j--)
            SWAP(x[i],x[j]);
   }

   void readin(intdist[][MAXSIZE], int *number)
   {
       int origin, dest, length, n;
       int i, j;
       char line[100];
      gets(line);
       sscanf(line, "%d", &n);
       *number = n;
       for (i = 0; i < n; i++)
       {
           for (j = 0; j <n; j++)
               dist[i][j] = INT_MAX;
           dist[i][i] =0;
       }
       gets(line);
       sscanf(line, "%d%d%d",&origin, &dest, &length);
       while (origin != 0 && dest != 0&& length != 0)
       {
          dist[origin-1][dest-1] =length;
         gets(line);
          sscanf(line,"%d%d%d", &origin, &dest, &length);
       }
   }
    /// 测试程序如下所示：
   int main(void)
   {
       int dist[MAXSIZE][MAXSIZE];
       int path[MAXSIZE][MAXSIZE];
       int n;
       printf("\nInput the pathinformation:");
      printf("\n----------------------------\n");
       readin(dist, &n);
       floyd(dist, path, n);
       display_path(dist, path, n);
       getchar();
   }
     其中readin函数规定了输入的格式，第一列是指出有多少个城市；第二列以后每行三个数；第一个和第二个是一条路径的起点和终点，第三个数是路径的长度，最后以三个0作为输入结束条件。下面是一个输入的例子：
             Input the path information:
           --------------------------------------
             4
             1         2          5
             2         1          50
             2         3          15
             2         4          5
             3         1          30
             3         4          15
             4         1          15
             4         3          5
             0         0          0
   对应的输出结果为：
     Origin->Dest     Dist          Path
----------------------------------------------
       1->2            5          1->2
       1->3           15          1->2->4->3
       1->4           10          1->2->4
       2->1           20          2->4->1
       2->3           10          2->4->3
       2->4            5          2->4
       3->1           30          3->1
       3->2           35          3->1->2
       3->4           15          3->4
       4->1           15          4->1
       4->2           20          4->1->2
       4->3            5          4->3