Deep Learning 最优化方法之Adam

来源：互联网发布：如何让牙齿整齐知乎编辑：程序博客网时间：2024/05/16 05:08

本文是Deep Learning 之最优化方法系列文章的Adam方法。主要参考Deep Learning 一书。

整个优化系列文章列表：

Deep Learning 之最优化方法

Deep Learning 最优化方法之SGD

Deep Learning 最优化方法之Momentum（动量）

Deep Learning 最优化方法之Nesterov(牛顿动量)

Deep Learning 最优化方法之AdaGrad

Deep Learning 最优化方法之RMSProp

Deep Learning 最优化方法之Adam

先上结论：

1.Adam算法可以看做是修正后的Momentum+RMSProp算法

2.动量直接并入梯度一阶矩估计中（指数加权）

3.Adam通常被认为对超参数的选择相当鲁棒

4.学习率建议为0.001

再看算法：其实就是Momentum+RMSProp的结合，然后再修正其偏差。
这里写图片描述

阅读全文

2 0

Deep Learning 最优化方法之Adam
Deep Learning 之最优化方法
Deep Learning 最优化方法之SGD
Deep Learning 最优化方法之AdaGrad
Deep Learning 最优化方法之RMSProp
Deep Learning 最优化方法之AdaGrad
Deep Learning 最优化方法之Momentum（动量）
Deep Learning 最优化方法之Nesterov(牛顿动量)
「Deep Learning」Adam
Deep learning中的优化方法
Deep Learning 优化方法总结
Deep Learning 优化方法总结
Deep Learning 优化方法总结
Deep Learning 优化方法总结
Deep learning：三十七(Deep learning中的优化方法)
Adam：一种随机优化方法
Deep Learning之常用模型或者方法
Deep Learning 优化小结
github中创建自己的cocoapod私有库_实操
【Java8源码分析】并发包-ConcurrentHashMap（一）
linux工作队列
读《超级询问术》作者Jim Pyle,Maryann Karinch
gulp---gulp常用插件
Deep Learning 最优化方法之Adam
curl安装
POJ2392-Space Elevator
Python学习之切片操作详解
简单的 quartz 调度任务结合spring 环境
volatile关键字的用法
cookie加密解密全过程，使用filter实现自动登录
Jmeter的安装
看后总结(Introduction to Computer Science and Programming,MIT 600)