AI中的几种搜索算法---基因算法

来源:互联网 发布:oracle数据库常用函数 编辑:程序博客网 时间:2024/05/29 18:10

AI中的几种搜索算法---基因算法

引言

进化计算(Evolutionary Computation)这个涵盖的范围比较广,其中包括基因算法(Genetic Algorithm)、进化式策略(Evolutionary Strategy)、基因程序(Genetic Programming)等等。这篇是进化计算的开篇,我会从基因算法入手,进而介绍进化计算中的一些基本思想。

一、基因算法的基本介绍

1.核心思想

基因算法与A*、Tabu、BFS等一些启发式算法,最大的不同便是:从针对个体,转变到针对由个体组成的“群体”(Population)。根据适应值(Fitness)来决定个体的优秀程度。

每一次操作,从群体中挑选两个优秀的个体,取出这两个个体的基因,进行拆分重组,从而得到新方案,放入新一代的群体中去。

其中利用到了生物学中的重组(Recombination)、选择(Selection)和突变(Mutation)。所以在学习这一算法的时候,不妨和生物学中一些概念进行类比,这样能够更好地理解基因算法的工作原理。

基因算法,在挑选的过程中,随机地挑选了两个优秀个体;在对两个个体的基因重组的时候,也引用了突变这一个不确定因素,整个过程貌似都笼罩在“随机”阴影下。确实在某种意义上,基因算法是一种随机搜索的算法。但必须指出的是基因算法在搜索能力上大大优于普通的随机搜索。

2.基因拆分重组

接下来介绍一些常用的基因重组算法。

一般来说,包括这三个操作:交叉(Crossover)、突变Mutation和倒置(Inversion)。

接下来我解释这三个操作:

1.     交叉

ParentA(1111111111111111)    ParentB(0000000000000000)

                    Crossover

ChildA(1111111100000000)     ChildB(0000000011111111)

就像上面,将ParentA切成两段,同时也将ParentB的基因链也切成两段。

先将ParentB的一半基因链接在ParentA的一半基因链后面,从而产生ChildA;同理可得ChildB,只是交换了ParentA和ParentB的顺序。

2.     突变

ParentA(1111111111111111)    ParentB(0000000000000000)

                   Mutation

ChildA(1111111101111111)     ChildB(0000000000100000)

这里ChildA从ParentA中得到了全部的基因,但是可以发现,其中ChildA中有一位是0,而0显然不是ParentA的基因,所以这便是突变。

同理可得ChildB。

3.     倒置

ParentA(1111111111111111)    ParentB(0000000000000000)

                   Inversion

ChildA(1111111100011111)     ChildB(0000000111100000)

这个操作的结果有点类似突变。其实这个的操作过程是这样的:去ParentA的一个片段,对这个片段中每一个基因进行取反,从而得到了ChildA。

3.基本流程

基因算法的流程也是简单易懂的,接下来就大致描述一下这个流程:

1.     首先便是创建群体,不断随机创建个体。

2.     从当前群体中挑选两个优秀个体,对其基因进行重组,生成两个新个体,这两个新个体便组成了新一代的群体。

3.     利用步骤2,创建一个与当前群体容量相当的新一代群体,便将新一代群体设定为当前群体。

4.     判断是否得到了我们所需要的个体,如果得到就停止算法。

5.     判断群体是否不再符合要求(失去了多样性),如果不符合就停止算法;如果符合就继续步骤3。

伪代码:

[cpp] view plain copy
 print?
  1. //  
  2. Population[2][NUM];  
  3. //随机获得NUM个个体,并放入群体Population[0]中去  
  4. Rand(Population[0]);  
  5. curGeneration = 0;  
  6. While(TRUE)  
  7. {  
  8. newGeneration = curGeneration == 1 ? 0 : 1;  
  9.    For(i = 0 ; i < NUM ; ++i)  
  10. {  
  11.    //select : 从当前群体Population中挑选优秀的个体作为此次操作的父辈  
  12.    ParantA =  Select(Population[curGeneration]);  
  13.    ParentB =  Select(Population[curGeneration]);  
  14.        //Recombination: 重组ParentA和ParentB的基因链,获得新个体Child  
  15.    Child  =  Recombination(ParentA,ParentB);      
  16. //计算新一代个体的适应值  
  17.    CalculateFitness(Child);  
  18.    //如果获得Child并不比父辈的优秀,重新重组  
  19.     If(Child.Fitness< ParentA.Fitness || Child.Fitness < ParentB.Fitness)  
  20.     {  
  21.       --i;  
  22.       Continue;  
  23. }  
  24. //将新个体加入新一代的群体中  
  25.     Population[newGeneration][i]= Child;  
  26. }  
  27. //当群体之间的个体差异很小的时候,考虑退出算法  
  28. If(avgfitness / maxfitness > 0.99999)    
  29.  Break;  
  30. curGeneration = newGeneration;  
  31. }  

二、TSP问题

1.TSP问题介绍

这里举TSP问题,TSP问题在另一篇文章《AI中的几种搜索算法---SA搜索算法》有提到过,那个时候主要用的是SA算法对这个问题进行了求解。

这里我们会用基因算法,再次求解这个问题。虽然已经介绍过TSP问题,这里为了阅读的方便,我就直接拷贝了《AI中的几种搜索算法---SA搜索算法》的部分内容。

TSP问题即旅行商问题:一个旅行商A被分配到一个任务,公司要求A去几个城市进行公司业务拓展,所以A就会拿出地图制定一个合理的路线。其中路线的要求便是消耗最小,并且能够从某一个城市出发,并且最后返回该城市时,已经访问过了所有城市。

2.TSP问题分析

这里我们可以计算出整个路线的路程。而这个路程和我们之前提到过的Fitness成反比,路程越长,表示这个路线越差。


对于这个公式,我稍作解释:Fitness就是我们一直提到的适应能力(适应值),Length(solution)计算路线solution的路程长度。

3. 杂交算子

这里我们介绍一个新的基因重组算法。较之于之前介绍的“交叉”、“突变”和“倒置”,这个算法会复杂一点。

杂交算子,算法来于《构建“基因库”求解TSP问题的混合遗传算法》

接下来开始介绍:

1.首先从当前群体中,随机选取两个优秀的个体作为父辈:ParentA和ParentB。

2.随机选取两个基因位置(即处于基因链中第几个位置):PosA1和PosA2。

3.找到ParentA基因链,PosA1和PosA2位置处的基因:G1和G2。

4.找到ParentB基因链中基因G1和G2所处的位置:PosB1和PosB2。

5.将ParentB基因链中,与处于ParentA基因链PosA1和PosA2之间相同的基因去掉。

6.然后如果PosB1 < PosB2,将处于ParentA基因链PosA1和PosA2之间的基因片段,在ParentB基因链的PosB1位置开始顺序插入;

如果PosB1 >= PosB2,将将处于ParentA基因链PosA1和PosA2之间的基因片段,在ParentB基因链的PosB2位置开始逆序插入。

7.经过步骤6之后,得到新个体Child,如果Child并没有比父辈优秀,则再回到步骤1,继续相同操作;如果新个体优于父辈,则将新个体放入新一代群体中,再继续产生下一个个体。


下面举一个具体的例子

随机取PosA1 = 3 , PosA2 = 6 , 得到基因G1 = 3 , G2 = 6

在ParentB基因链的位置PosB1 = 8 , PosB2 = 5

ParentA :  1    2    3     4    5    6    7    8    9

ParentB:   2    4   7     8    6    5   1     3    9


将ParentB基因链,去除基因 3,4,5,6

得到:

ParentB:  2    x    7    8    x    x   1     x    9

 

因为PosB1 > PosB2,所以在PosB2处开始逆序插入(3,4,5,6)

得到:

Child:    2    7    8     6    5    4    3     1   9

4.   代码

如果想要详细了解可以去基因算法解决TSP问题处下载

下面是整个基因算法的流程代码:

[cpp] view plain copy
 print?
  1. //  
  2. int tsp_ga(City * cities,intnCities,int ** path)  
  3. {  
  4.     srand(time(NULL));//  
  5.     *path = new int[nCities];  
  6.     floatsumCurFitness ;  
  7. //初始化群体,随机得到一群个体  
  8.     InitPopulation(cities,nCities,sumCurFitness);  
  9.     intcurGeneration = 0,generation = 0;  
  10.     int iBest =0;  
  11.     for(;1 ;++generation)//循环  
  12.     {  
  13.          int newGeneration = curGeneration == 0 ? 1 : 0;  
  14.          float sumFitness = 0.0 , maxFitness = 0.0;  
  15.           //开始获得新个体  
  16.          for (int i = 0 ; i< NUMPOPULATION ; ++i)  
  17.          {  
  18.               //选取优秀个体作为父辈  
  19.              int parenta =SelectParent(curGeneration,sumCurFitness);  
  20.              int parentb =SelectParent(curGeneration,sumCurFitness);  
  21.             //开始重组父辈的基因链,获得新个体  
  22.              //这里使用上面介绍的杂交算法  
  23.  Recombination(population[curGeneration][parenta],population[curGeneration][parentb],  
  24.                  population[newGeneration][i],nCities);  
  25.               //计算新个体的fitness  
  26.              CaculateFitness(cities,nCities,population[newGeneration][i]);  
  27.              float fitness= population[newGeneration][i].fitness;  
  28.               //如果新个体并没有比父辈优秀,重新产生新个体  
  29.              if(fitness< population[curGeneration][parenta].fitness || fitness <population[curGeneration][parentb].fitness)  
  30.              {  
  31.                  --i;  
  32.                  continue;  
  33.              }  
  34.              if(fitness> maxFitness)  
  35.              {  
  36.                  maxFitness = fitness;  
  37.                  iBest = i;  
  38.              }  
  39.              sumFitness += fitness;  
  40.          }  
  41.          sumCurFitness = sumFitness;  
  42.          curGeneration = newGeneration;  
  43.          float result = sumFitness / (maxFitness*NUMPOPULATION );  
  44.          if( result >  0.99999)//如果群体中个体差异很小,停止算法  
  45.              break;  
  46.     }  
  47.     for (int i = 0 ; i < nCities ; ++i)  
  48.     {  
  49.         (*path)[i] =population[curGeneration][iBest].path[i];  
  50.     }  
  51.      
  52.     //清理资源  
  53.     for (int i  = 0;  i < NUMPOPULATION ; ++i)  
  54.     {  
  55.         delete[]population[0][i].path;  
  56.         delete[]population[1][i].path;  
  57.     }  
  58.     returngeneration;  
  59. }  

//下面就是基因链重组算法的实现代码

[cpp] view plain copy
 print?
  1. void Recombination(constIndividual & parenta,const Individual &parentb,Individual & child,int n)  
  2. {  
  3.     int posa1 =rand()%(n-1);  
  4.     int posa2 =rand()%n;  
  5.     while(posa2<= posa1)  
  6.         posa2 = rand()%n;  
  7.     //  
  8.     int lseg =posa2 - posa1 + 1;  
  9.     int * genseg= new int[lseg];  
  10.     for(int i = posa1 ; i <= posa2 ; ++i)  
  11.         genseg[i-posa1] = parenta.path[i];  
  12.     ////  
  13.     int posb1 =-1,posb2 = -1;  
  14.     int iChild =0 , iStartInsert = 0;  
  15.     for(int i = 0 ; i < n ; ++i)  
  16.     {  
  17.         int gb =parentb.path[i];  
  18.         int j =0;  
  19.         for(; j< lseg; ++j)  
  20.         {  
  21.             intg = genseg[j];  
  22.             if(gb== g)  
  23.             {  
  24.                 if(0== j)  
  25.                 {  
  26.                     posb1 = i;  
  27.                     iStartInsert = iChild;  
  28.                     iChild += lseg;  
  29.                 }  
  30.                 elseif(j == (lseg-1))  
  31.                     posb2 = i;  
  32.                 break;  
  33.             }  
  34.         }  
  35.         //  
  36.         if(lseg== j)  
  37.         {  
  38.             child.path[iChild++] = gb;  
  39.         }  
  40.     }  
  41.     if(posb1< posb2)  
  42.         for(int i = 0 ; i < lseg ; ++i)  
  43.             child.path[i + iStartInsert] =genseg[i];  
  44.     else  
  45.         for(int i = 0 ; i < lseg ; ++i)  
  46.             child.path[i + iStartInsert] =genseg[lseg - i -1];  
  47.     delete[]genseg;  
  48. }  

5.   效果图

 

三、总结

基因算法总的来说体现了一个“优胜劣汰”的法则,优秀的基因存活下来。而且基因算法从针对于个体转到了群体,有别于A*这些普通的启发式算法。

 

其中我在实现这个算法的时候,在尝试基因链重组算法的时候,一直没有找到一个能够保证优秀基因遗传下去的好方法,所在在网上搜了一下关于TSP和基因算法,找到了一篇论文《构建“基因库”求解TSP问题的混合遗传算法》,有兴趣的读者可以去看一下这篇文章。

 

如果有兴趣的可以留言,一起交流一下算法学习的心得。

声明:本文章是笔者整理资料所得原创文章,如转载需注明出处,谢谢。

0 0
原创粉丝点击