最优化中的惩罚函数

来源：互联网发布：js 字符串转boolean 编辑：程序博客网时间：2024/04/29 09:33

最近对文章中的惩罚函数不是很理解，今天整理一下。

讲到惩罚函数，首先要提到约束问题，所谓的约束问题就是在一定的约束条件下，求得问题的最优解

例如 min f（x） s.t. gi(x)>0,hj(x)=0 i=1,..m,j=1,2,...l。其中s.t.是subject to的缩写，即服从，满足的意思。

这类问题的可行解法是梯度下降算法，或者是序列无约束优化方法：即通过求解一系列无约束问题的解来近似约束问题的解。

罚函数法则是序列无约束问题算法的典型代表。

罚函数的基本思想是构造辅助函数，把原来的约束问题转化为求极小化辅函数的无约束问题

例如可以定义函数F：Rn->R 为

F（x ）={f（x），xED

+Inf，x！E D

那么问题就转化为了在xERn中，求解F（x）的最小值了。

因为只是做一个大概的了解，具体内容可以参考http://wenku.baidu.com/link?url=EfpEMJYgIo1Y3yIJoJsh8jHfFj2GY4NWV74Xk_csRo3xSQ3yx6_iuXyxa9EG70T-qW5pOlKxlm_D-e04cndIXkklD5mUukYrdroJJPOxPQ3

北邮的一个PPT

0 0