模拟退火算法

来源：互联网发布：自己设计室内装修软件编辑：程序博客网时间：2024/04/28 20:47

模拟退火算法

　　模拟退火算法来源于固体退火原理，将固体加温至充分高，再让其徐徐冷却，加温时，固体内部粒子随温升变为无序状，内能增大，而徐徐冷却时粒子渐趋有序，在每个温度都达到平衡态，最后在常温时达到基态，内能减为最小。根据Metropolis准则，粒子在温度T时趋于平衡的概率为e-ΔE/(kT)，其中E为温度T时的内能，ΔE为其改变量，k为Boltzmann常数。用固体退火模拟组合优化问题，将内能E模拟为目标函数值f，温度T演化成控制参数t，即得到解组合优化问题的模拟退火算法：由初始解i和控制参数初值t开始，对当前解重复“产生新解→计算目标函数差→接受或舍弃”的迭代，并逐步衰减t值，算法终止时的当前解即为所得近似最优解，这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。退火过程由冷却进度表(Cooling Schedule)控制，包括控制参数的初值t及其衰减因子Δt、每个t值时的迭代次数L和停止条件S。

1 . 模拟退火算法的模型

　　模拟退火算法可以分解为解空间、目标函数和初始解三部分。
　模拟退火的基本思想:
　　(1) 初始化：初始温度T(充分大)，初始解状态S(是算法迭代的起点)，每个T值的迭代次数L
　　(2) 对k=1，……，L做第(3)至第6步：
　　(3) 产生新解S′
　　(4) 计算增量Δt′=C(S′)-C(S)，其中C(S)为评价函数
　　(5) 若Δt′<0则接受S′作为新的当前解，否则以概率exp(-Δt′/T)接受S′作为新的当前解.
　　(6) 如果满足终止条件则输出当前解作为最优解，结束程序。
终止条件通常取为连续若干个新解都没有被接受时终止算法。
　　(7) T逐渐减少，且T->0，然后转第2步。
算法对应动态演示图：
模拟退火算法新解的产生和接受可分为如下四个步骤：
　　第一步是由一个产生函数从当前解产生一个位于解空间的新解；为便于后续的计算和接受，减少算法耗时，通常选择由当前新解经过简单地变换即可产生新解的方法，如对构成新解的全部或部分元素进行置换、互换等，注意到产生新解的变换方法决定了当前新解的邻域结构，因而对冷却进度表的选取有一定的影响。
　　第二步是计算与新解所对应的目标函数差。因为目标函数差仅由变换部分产生，所以目标函数差的计算最好按增量计算。事实表明，对大多数应用而言，这是计算目标函数差的最快方法。
　　第三步是判断新解是否被接受,判断的依据是一个接受准则，最常用的接受准则是Metropo1is准则: 若Δt′<0则接受S′作为新的当前解S，否则以概率exp(-Δt′/T)接受S′作为新的当前解S。
　　第四步是当新解被确定接受时，用新解代替当前解，这只需将当前解中对应于产生新解时的变换部分予以实现，同时修正目标函数值即可。此时，当前解实现了一次迭代。可在此基础上开始下一轮试验。而当新解被判定为舍弃时，则在原当前解的基础上继续下一轮试验。
　　模拟退火算法与初始值无关，算法求得的解与初始解状态S(是算法迭代的起点)无关；模拟退火算法具有渐近收敛性，已在理论上被证明是一种以概率l 收敛于全局最优解的全局优化算法；模拟退火算法具有并行性。

2 模拟退火算法的简单应用

　　作为模拟退火算法应用，讨论货郎担问题(Travelling Salesman Problem，简记为TSP)：设有n个城市，用数码1,…,n代表。城市i和城市j之间的距离为d(i，j) i, j=1,…,n．TSP问题是要找遍访每个域市恰好一次的一条回路，且其路径总长度为最短.。
　　求解TSP的模拟退火算法模型可描述如下：
　　解空间解空间S是遍访每个城市恰好一次的所有回路，是{1，……，n}的所有循环排列的集合，S中的成员记为(w1,w2 ,……，wn)，并记wn+1= w1。初始解可选为(1，……，n)
　　目标函数此时的目标函数即为访问所有城市的路径总长度或称为代价函数：

　　我们要求此代价函数的最小值。
　　新解的产生随机产生1和n之间的两相异数k和m，若k<m，则将
　　(w1, w2 ,…，wk , wk+1 ,…，wm ,…，wn)
　　变为：
　　(w1, w2 ,…，wm , wm-1 ,…，wk+1 , wk ,…，wn).
　　如果是k>m，则将
　　(w1, w2 ,…，wk , wk+1 ,…，wm ,…，wn)
　　变为：
　　(wm, wm-1 ,…，w1 , wm+1 ,…，wk-1 ,wn , wn-1 ,…，wk).
　　上述变换方法可简单说成是“逆转中间或者逆转两端”。
　　也可以采用其他的变换方法，有些变换有独特的优越性，有时也将它们交替使用，得到一种更好方法。
　　代价函数差设将(w1, w2 ,……，wn)变换为(u1, u2 ,……，un), 则代价函数差为：

根据上述分析，可写出用模拟退火算法求解TSP问题的伪程序：
Procedure TSPSA:
　begin
　　init-of-T; { T为初始温度}
　　S={1，……，n}; {S为初始值}
　　termination=false;
　　while termination=false
　　　begin
　　　　for i=1 to L do
　　　　　　begin
　　　　　　　　generate(S′form S); { 从当前回路S产生新回路S′}
　　　　　　　　Δt:=f(S′))-f(S);{f(S)为路径总长}
　　　　　　　　IF(Δt<0) OR (EXP(-Δt/T)>Random-of-[0,1])
　　　　　　　　S=S′;
　　　　　　　　IF the-halt-condition-is-TRUE THEN
　　　　　　　　termination=true;
　　　　　　End;
　　　　T_lower;
　　　End;
　End
　　模拟退火算法的应用很广泛，可以较高的效率求解最大截问题(Max Cut Problem)、0-1背包问题(Zero One Knapsack Problem)、图着色问题(Graph Colouring Problem)、调度问题(Scheduling Problem)等等。

3 模拟退火算法的参数控制问题
　　模拟退火算法的应用很广泛，可以求解NP完全问题，但其参数难以控制，其主要问题有以下三点：
　　(1) 温度T的初始值设置问题。
　　温度T的初始值设置是影响模拟退火算法全局搜索性能的重要因素之一、初始温度高，则搜索到全局最优解的可能性大，但因此要花费大量的计算时间；反之，则可节约计算时间，但全局搜索性能可能受到影响。实际应用过程中，初始温度一般需要依据实验结果进行若干次调整。
　　(2) 退火速度问题。
　　模拟退火算法的全局搜索性能也与退火速度密切相关。一般来说，同一温度下的“充分”搜索(退火)是相当必要的，但这需要计算时间。实际应用中，要针对具体问题的性质和特征设置合理的退火平衡条件。
　　(3) 温度管理问题。
　　温度管理问题也是模拟退火算法难以处理的问题之一。实际应用中，由于必须考虑计算复杂度的切实可行性等问题，常采用如下所示的降温方式：

T(t+1)＝k×T(t)
式中k为正的略小于1.00的常数，t为降温的次数

模拟退火算法求解TSP问题

作者：ymhui

下载源代码

一、问题描述
　　旅行商问题，即TSP问题（Travelling Salesman Problem）是数学领域中著名问题之一。假设有一个旅行商人要拜访n个城市，他必须选择所要走的路径，路经的限制是每个城市只能拜访一次，而且最后要回到原来出发的城市。路径的选择目标是要求得的路径路程为所有路径之中的最小值。

图1 TSP问题的示意图

二、遍历算法
　　一个最容易想到的方法是利用排列组合的方法把所有的路径都计算出来，并逐一比较，选出最小的路径。虽然该方法在理论上是可行的，但路径的个数与城市的个数成指数增长，当城市个数较大时，该方法的求解时间是难以忍受的，甚至是不可能完成的。以每秒1亿次的计算速度来估算，如果TSP问题包含20个城市时，求解时间长达350年；如果要处理30个城市，则求解时间更长达1+10e16年。如此长的时间，在实际中完成是难以想象的。

三、模拟退火算法
　　模拟退火算法是解决TSP问题的有效方法之一，其最初的思想由Metropolis在1953年提出，Kirkpatrick在1983年成功地将其应用在组合最优化问题中。
　　模拟退火算法来源于固体退火原理，将固体加温至充分高，再让其徐徐冷却，加温时，固体内部粒子随温升变为无序状，内能增大，而徐徐冷却时粒子渐趋有序，在每个温度都达到平衡态，最后在常温时达到基态，内能减为最小。用固体退火模拟组合优化问题，将内能E模拟为目标函数值f，温度T演化成控制参数t，即得到解组合优化问题的模拟退火算法：由初始解i和控制参数初值t开始，对当前解重复“产生新解→计算目标函数差→接受或舍弃”的迭代，并逐步衰减t值，算法终止时的当前解即为所得近似最优解，这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。

　　求解TSP的模拟退火算法模型可描述如下:
　　解空间：解空间S是遍访每个城市恰好一次的所有路经，解可以表示为{w1,w2 ,……, wn}，w1, ……, wn是1,2,……,n的一个排列，表明w1城市出发，依次经过w2, ……, wn城市，再返回w1城市。初始解可选为(1,……, n) ; 　　
　　目标函数：目标函数为访问所有城市的路径总长度; 　　
　　我们要求的最优路径为目标函数为最小值时对应的路径。　　
　　新路径的产生：随机产生1和n之间的两相异数k和m，不妨假设k<m，则将原路径
　　(w1,w2,…,wk,wk+1,…,wm,wm+1,…,wn)
　　变为新路径：
　　(w1,w2,…,wm,wk+1,…,wk,wm+1,…,wn)上述变换方法就是将k和m对应的两个城市在路径序列中交换位置,称为2-opt映射。根据上述描述，模拟退火算法求解TSP问题的流程框图如下

图2 模拟退火算法的流程框图

四、主要代码
　　对应于流程框图，实现流程的主体函数是SACompution()，代码如下：

UINT SACompution(LPVOID pParam){while(1){double deltatotaldis = 0.0;while(1){SYRouter SelRouter( ResultRouter.m_CityRouter,                     NowTemperature,                     NowExternalIterNumber,                    NowInnerIterNumber );//从某路径的邻域中随机选择一个新的路径，邻域映射为2-optdeltatotaldis = SelRouter.m_fTotalDistance-ResultRouter.m_fTotalDistance;//计算新路径与当前路径的路程长度差值if( deltatotaldis <= 0.0 )ResultRouter = SelRouter;//如果新路径的路程短，则用它替换当前路径else{double chgprobability = exp( -(deltatotaldis/NowTemperature) );int randomnum = rand();double random = ((double)(randomnum%10000))/10000.0;if(chgprobability > random )ResultRouter = SelRouter;//如果新路径长于当前路径，但exp(-Δf/t) > random(0,1)，则仍然替换当前路径}if( JudgeOverInnerLoop(0) )break; //判断内循环是否结束，结束则跳出当前温度的内循环elseNowInnerIterNumber++;//判断内循环是否结束，不结束则继续内循环}if( JudgeOverExternalLoop(0) )break;//判断外循环是否结束，结束则结束模拟退火计算else{NowTemperature = CountDownTemperature( NowTemperature, 0 );NowExternalIterNumber++;NowInnerIterNumber = 0;//判断外循环是否结束，不结束则计算出下降后的温度，并继续循环}}}

五、算例测试
　　程序对48个城市的TSP问题（城市坐标文件对应于48.txt，已放在发布的源码中）进行计算，求解得到的最优路径图如下。

图3 模拟退火算法获得的最优路径图

　　48个城市的计算结果，大的红*表示路径开始城市，途经城市依次用蓝色方块和红色*标示。

六、调试环境
　　Windows XP Professional
　　Visual C++ 6.0
　　STLport 4.6.2