信赖域(Trust Region)
来源:互联网 发布:写作软件app 编辑:程序博客网 时间:2024/05/16 10:37
信赖域算法TR可以用来求解非线性规划问题(NLP, NonLinear Programing),比如含二次项问题的优化求解,但其实它跟线搜索方法一样,大量形式的优化问题都可以通过泰勒展开为(1)的形式,进而可以采用TR方法,不足之处是
求解过程中,第k步,我们是通过求
是信赖域问题的子问题,其中
如果上式中
- a) 通过柯西点来让
mk 减少地尽量多来达到或接近最小化。 - b)
Bk 正定时,采用Dogleg(狗腿)方法。 - c) 在
Bk 非正定时,采用two-dimensional subspace minimization(二维子空间最小化)方法。
这三种策略可以参考博客,有非常详细的介绍。
线搜索方法用得比信赖域方法广泛,是不是说明信赖域方法没有优点呢?
举个简单的例子,求解:
如果直接用线搜索,初始点在0处无法进行下一步的搜索,因为梯度为0.
而使用TR:
结论:
1.TR方法要求步长p,求解p的子问题是有约束的。
2.结合Dogleg算法或共轭梯度法能有超线性的收敛速度。
http://www.mcs.anl.gov/~anitescu/CLASSES/2012/LECTURES/S310-2012-lect5.pdf
https://optimization.mccormick.northwestern.edu/index.php/Trust-region_methods
阅读全文
0 0
- 信赖域(Trust Region)
- 信赖域(Trust Region)算法
- Trust-Region with DogLeg method 信赖域和狗腿法的最优化求解
- TRPO(trust region policy optimization)(2)
- Trust Region Policy Optimization
- TRPO(Trust Region Policy Optimization)(1)
- line search and trust region
- Trust region policy optimization笔记
- line search and trust region----continue
- 读论文Trust Region Policy Optimization
- PR10.21:Trust Region Policy Optimization
- 信赖
- 数值优化(Numerical Optimization)学习系列-信赖域方法
- 信赖域求解Rosenbrock函数(LM求解子问题)
- trust
- httpClient设置忽略SSL(trust all)
- #region(C# 参考)
- #region(C# 参考)
- Attributions——属性控件
- H5直播避坑指南
- c语言解析类似json类型的字符串
- 从输入 URL 到页面展示,到底发生了什么
- 最短路
- 信赖域(Trust Region)
- 使用ANT打包Android应用
- IDEA Maven打包时去掉test
- 一个Windows安装Tomcat运行startup闪退问题及环境变量的配置
- 第一个博客
- php is_writeable函数bug问题
- MATLAB 根据条件修改TXT文本内容
- 给初学者的RxJava2.0教程(一)
- android加载so问题