概率统计与机器学习:机器学习常见名词解释(过拟合,偏差方差)
来源:互联网 发布:chart.js详细参数 编辑:程序博客网 时间:2024/06/05 09:41
过拟合,欠拟合
过拟合和欠拟合
仍旧以线性回归举例,f(x,w)=w1x1+w2x2...wnxn
我们要在损失函数最小的情况下得到权值wE=∑Ni=1(yi−f(x,w))2
但是阶数N也是需要考虑的,比如一阶就是一条线,特别大就是一条奇奇怪怪的曲线分别穿过数据点显然,前者根本就穿不完,后者是穿的太完美,都是非常危险的。引入一张PRML书里的图来解释形象的描述:
我们正确的函数是正弦函数,现在想让模型学习这写点,阶数小的穿不过去,而阶数高的模型过于复杂导致如果出现别的正确点却无法在测试集上很好发挥的情况。对应的即是 过拟合和欠拟合。模型容量(复杂度)和模型泛化
- 模型容量:以线性回归为例,模型如果太过简单,那么显然并不能很好的拟合数据;相反,如果模型复杂度特别大,在训练集上可能会非常好的“记住”了这些特征,但是到测试集上就会崩,就好比我们死记硬背了例题换个样子就不会做了。即:增大模型容量,训练误差和测试误差都会下降,但是过度增加仍然会导致测试误差上升
- 模型泛化:泛化指的是我们将我们的模型可以应用于其他场景,有些看样子学习的很好,实际上根本就不科学,也就是不可学。普适逼近定理:只要给定足够多的神经元,单隐层全连接网络表达能力总是足够强的。话是这么说,但是讲表达能力是没意义的,表达了不代表学习到了,我们最终的目的是要有一个很好学习能力的模型而不是为了某个东西而表达出来,这和死记硬背例题没有什么区别。
偏差(Bias)与方差(Variance)
- 在讲此处概念先引入一张很经典的图
取自http://scott.fortmannroe.com/docs/BiasVariance.html
分别阐述了:低偏差低方差,低偏差高方差,高偏差低方差,高偏差高方差
我们以射击打靶为例: - 低偏差低方差:神枪手,打的准发挥稳定
- 低偏差高方差:发挥很不稳定,有时候打的准有时候不准
- 高偏差低方差:可能由于枪或者眼神的问题,发挥的稳定只是打的不准
- 高偏差高方差:完全不会玩,乱打的那种
因此我们得出了偏差和方差的定义:
- 偏差(Bias):反应的是观测数据和真实值之间的差距,偏差越大,越偏离真实数据
- 方差(Variance):反应的是预测值的变化范围,也就是模型的离散程度,方差越大代表模型分布越分散
相关推导:
最小二乘回归中的偏差-方差分解:
在已知真实值
那么真实值:
由平方误差函数得
展开:
=
即:
偏差与方差的权衡:
我们假设有一个九阶多项式,它实际为了拟合一个正弦函数,并加入了正则化系数
那么如果正则化的约束使得模型复杂度越来越低,比如将正弦拟合成了一根线,该如何表现:
1.
2.
3.
4.test error :对应的就是第三种情况,偏差方差反应的是原始模型的好坏,因此会影响到测试集的发挥,哪怕测试集原本效果很好,被约束的很过分也会导致在测试机上效果非常差。
附上一张图,摘自PRML
常见机器学习病症解决方案:
- 增加训练集数量
- 降低模型复杂度
- 提升模型复杂度
- 采用多模型设置
- 采用Adaboost对多个弱模型进行提升
- 概率统计与机器学习:机器学习常见名词解释(过拟合,偏差方差)
- 机器学习:偏差、方差与欠拟合、过拟合
- 机器学习:方差Variance与偏差Bias
- 理解机器学习中的偏差与方差
- 机器学习中的偏差与方差
- 理解机器学习中的偏差与方差
- 理解机器学习中的偏差与方差
- 【机器学习】过拟合与欠拟合
- 机器学习--欠拟合与过拟合
- 机器学习中拟合与过拟合
- 机器学习过拟合
- 机器学习过拟合
- 概率统计与机器学习:期望,方差,数学期望,样本均值,样本方差之间的区别
- 李宏毅机器学习2016 第二讲 偏差与方差
- 机器学习中的偏差和方差
- 机器学习中的偏差和方差
- 机器学习中的偏差和方差
- 机器学习:诊断偏差和方差
- 南阳OJ 题目56-阶乘因式分解(一)
- 【Dubbo+Zookeeper】Dubbo初见
- 关于java中封装类的详细解释
- UML之部署图(Deployment Diagram)设计与示例
- 14控制类名className
- 概率统计与机器学习:机器学习常见名词解释(过拟合,偏差方差)
- D3.js的缩放和根据指定名称进行节点之间的连线
- 把自己的应用程序push至system/app下,把自己的app改成系统级别的app
- LINUX之基本命令的使用
- vue.js基础-处理用户输入与双向数据绑定
- GHGL项目-其他问题锦集
- Android 通过post上传文件--HttpURLConnection实现
- mosquitto(mqtt)服务部署+redis 认证模块
- hutool java工具架包功能介绍