机器学习中的正则化
来源:互联网 发布:京东抢券软件安卓 编辑:程序博客网 时间:2024/06/05 12:01
机器学习中的正则化
@(《机器学习》西瓜书)
在看周志华老师的《机器学习》——神经网络这节时,读到一段话:
BP神经网络由于其强大的表示能力,经常遭遇过拟合情况,而防止过拟合情况最有效的策略就是“正则化”,其基本思想就是在损失函数中增加一个能描述其网络复杂度的部分,书中选择的是连接权和阈值的平方和。
增加连接权和阈值平方和这一项后,训练过程将会偏好比较小的连接权和阈值,使得网络输出更加光滑,从而对过拟合有所缓解。
看到上述红体字不禁自问:为什么偏好比较小的?为什么更光滑?如何抑制过拟合?
翻看博客以及以往Coursera上的视频讲解,豁然开朗!
先从最简单的线性模型举例:
以上三幅图分别表示欠拟合—合适拟合—过拟合,我们可以看到过拟合实际是由于特征高次幂对函数影响较大,导致过拟合。
如果可以抑制
这也是正则化思想的由来:加入惩罚因子
所以:线性模型的损失函数由
变为:
对应的梯度:
则,加了正则化之后,对应的
我们看到参数
- 算法依然正常工作,
- 但算法可能会变成欠拟合,因为
- 梯度下降算法不一定会收敛
看到这里已经可以理解上述红字部分的话了,减少高次幂特征的影响,网络输出会更加光滑,而且连接权和阈值会偏小一些,缓解了过拟合。
阅读全文
0 0
- 机器学习中的正则化
- 机器学习中的正则化
- 机器学习中的正则化
- 机器学习中的正则化
- 机器学习中的正则化技术
- 机器学习中的正则化简介
- 机器学习中的正则化处理
- 机器学习:正则化
- 机器学习:正则化
- 机器学习正则化
- 机器学习-正则化
- 机器学习正则化
- 机器学习 正则化
- 机器学习正则化
- 机器学习中的正则化和范数规则化
- 机器学习中的正则化项的理解
- 机器学习之正则化
- 【机器学习基础】正则化
- 测试java
- UVa 1592 Database
- 通过串口log信息解决无限重启问题——空指针异常
- 2017开学训练第五周周中总结
- 解决CentOS下无法发送邮件的问题 + selinux
- 机器学习中的正则化
- Spring源码学习之认识AOP
- slf4j配置实例
- kafka可靠性
- jsp使用session对象模拟在线考试系统
- token android.os.BinderProxy@163442e0 is not valid; is your activity running
- InteliJ IDEA用Maven搭建Mybatis框架
- jQuery学习_动作效果(隐藏、显示、切换,滑动,淡入淡出,以及动画)
- POJ