梯度下降实用技巧I之特征缩放 Gradient Descent in practice I - feature scaling
来源:互联网 发布:手机摄影软件 编辑:程序博客网 时间:2024/05/16 20:27
梯度下降实用技巧I之特征缩放 Gradient Descent in practice I - feature scaling
当多个特征的范围差距过大时,代价函数的轮廓图会非常的偏斜,如下图左所示,这会导致梯度下降函数收敛的非常慢。因此需要特征缩放(feature scaling)来解决这个问题,特征缩放的目的是把特征的范围缩放到接近的范围。当把特征的范围缩放到接近的范围,就会使偏斜的不那么严重。通过代价函数执行梯度下降算法时速度回加快,更快的收敛。如下图右所示。
特征缩放的范围:一般把特征的范围缩放到-1到1,和这接近就行,没必要同一范围。梯度下降就能很好的工作。如下图所示,x1 的范围为0到3,x2的范围为-2到0.5都是可以的。但不能相差的很大,-100到100则是不可以的。
特征缩放的方法:直接先看图再解释,主要是均值归一化
一般的均值归一化公式为: ,其中为均值,s为特征的范围,即max-min。也可以用标准差。
0 0
- 梯度下降实用技巧I之特征缩放 Gradient Descent in practice I - feature scaling
- 4 - 3 - Gradient Descent in Practice I - Feature Scaling (9 min)
- 梯度下降实用技巧II之学习率 Gradient descent in practice II -- learning rate
- linear regression(3)-Gradient Descent in Practice I/II(Feature Scalling/Learning Rate)
- Gradient Descent 0 - Feature Scaling
- 梯度下降(Gradient Descent)
- 梯度下降Gradient descent
- Feature Scaling 特征缩放
- 特征缩放(Feature Scaling)
- feature scaling 特征缩放
- 特征缩放(feature scaling)
- 梯度下降算法- gradient descent
- 梯度下降算法(Gradient Descent)
- 大话梯度下降Gradient Descent
- gradient descent 梯度下降算法
- 梯度下降(gradient descent)
- 梯度下降(Gradient descent)
- 梯度下降算法(Gradient descent)
- 网络基础:子网掩码划分1
- Java中Map的遍历方式
- 配置SQL Server数据库连接
- gdb编译完成后找不到函数
- 向别人学习之我的第一任老板
- 梯度下降实用技巧I之特征缩放 Gradient Descent in practice I - feature scaling
- 集合的遍历(多线程)及ConcurrentModificationException
- android 视频 播放 (VideoView的小实例)
- java输入输出流FileInputStream,FileOutputStream,BufferedInputStream,BufferedOutputStream知识点总结
- 递归算法实现全排列
- 打开二级列表,关闭其他二级列表
- Datacastle人品预测大赛比赛总结
- 火车进站
- 在JLabel上显示图片,并且图片自适应JLabel的大小