随机梯度算法
来源:互联网 发布:基于单片机led旋转显示 编辑:程序博客网 时间:2024/05/17 02:28
随机梯度下降–Stochastic Gradient Descent | 丕子 http://www.zhizhihu.com/html/y2012/3731.html
在求损失度最小值时,我们一般用到导数为0时求相应参数,但有时会导致很高的计算复杂度。这时,就要乃至随机梯度下降算法了,是用来简化求最小值的计算的。先给W一个初始值,然后朝梯度方向下降,直到不能下降为止,此时即可得到对应的极小值,但注意得到的是局部最小值,有时要对初始值进行不断修正。
但这样,每iteration一次就得用所有数据求一次导数,代价太大,那么每一步只随机抽几个数据点来算一个梯度如何呢?当然可以!这被称之为Stochastic Gradient Descent,非常高效(随机梯度下降算法)。
记得在ML中的目标函数通常是损失+罚()的形式。例如ridge regression就是平方误差+罚,lasso是平方误差+罚,SVM是hinge loss+罚。最小化这个目标函数可以等价于在的限制下最小化。和是一一对应的关系。实际上就是定义了一个凸子空间,例如使用罚时就是一个半径为的球。所以,Online Gradient Descent可以online的解这一类目标函数,只是对于不同的罚选择不同的投影子。
下面是理论分析。记投影前的,以及offline最优解。因为是凸的且在其中,所以对投影只会减少其与的距离,既。记,注意到
由于是凸的,所以有
取固定的,对进行累加就有。记的直径为,且对所有有成立(既Lipschitz常数为),再取,那么
这个bound可以通过设置变动的学习率加强。
- 随机梯度下降算法
- 随机梯度算法
- 随机梯度下降算法
- 随机梯度下降算法
- 随机梯度下降算法
- 梯度下降算法与随机梯度下降
- 随机梯度下降算法 matlab
- 随机梯度下降算法学习心得
- 梯度下降算法、随机梯度下降算法scala实现
- 神经网络算法学习---梯度下降和随机梯度下降
- 并行随机梯度下降算法 PSGD
- 感知机2 -- 随机梯度下降算法
- SparkMLlib---SGD随机梯度下降算法
- spark mlib中的随机梯度下降算法
- svm随机次梯度下降算法-pegasos
- 梯度算法之批量梯度下降,随机梯度下降和小批量梯度下降
- 批量梯度下降算法和随机梯度下降算法的代码实现
- 神经网络与深度学习(2):梯度下降算法和随机梯度下降算法
- directx-01-梦开始的地方
- 网页布局之Div vs Table (2)
- Acegi的研究
- Eclipse的自动build选项,制造时别忘了选上~
- 一步一学Linux与Windows 共享文件Samba (v0.2b)
- 随机梯度算法
- iphone各种动画
- Ipad开发课程系列目录--很好的教程,推荐给大家
- 蛇形环绕。又叫上三角算法
- 使用 Apache MINA 2 开发网络应用
- ORA-27101: shared memory realm does not exist 错误的处理(ORA-01034 - Oracle not available )
- Apache开启Gzip和Expires提升网页加载速度
- 使用Hibernate插入oracle Date类型的例子
- 机器学习和计算机视觉有关的数学