最优化中的惩罚函数

来源:互联网 发布:js 字符串转boolean 编辑:程序博客网 时间:2024/04/29 09:33

最近对文章中的惩罚函数不是很理解,今天整理一下。

讲到惩罚函数,首先要提到约束问题,所谓的约束问题就是在一定的约束条件下,求得问题的最优解

例如 min f(x) s.t. gi(x)>0,hj(x)=0   i=1,..m,j=1,2,...l。其中s.t.是subject to的缩写,即服从,满足的意思。

这类问题的可行解法是梯度下降算法,或者是序列无约束优化方法:即通过求解一系列无约束问题的解来近似约束问题的解。

罚函数法则是序列无约束问题算法的典型代表。

罚函数的基本思想是构造辅助函数,把原来的约束问题转化为求极小化辅函数的无约束问题

例如可以定义函数F:Rn->R

F(x )={f(x),xED

+Inf,x!E D


那么问题就转化为了在xERn中,求解F(x)的最小值了。


因为只是做一个大概的了解,具体内容可以参考http://wenku.baidu.com/link?url=EfpEMJYgIo1Y3yIJoJsh8jHfFj2GY4NWV74Xk_csRo3xSQ3yx6_iuXyxa9EG70T-qW5pOlKxlm_D-e04cndIXkklD5mUukYrdroJJPOxPQ3

北邮的一个PPT

0 0