过拟合解决方案
来源:互联网 发布:蘑菇街的域名是什么 编辑:程序博客网 时间:2024/06/07 03:09
方法一:尽量减少选取变量的数量
具体而言,我们可以人工检查每一项变量,并以此来确定哪些变量更为重要,然后,保留那些更为重要的特征变量。至于,哪些变量应该舍弃,我们以后在讨论,这会涉及到模型选择算法,这种算法是可以自动选择采用哪些特征变量,自动舍弃不需要的变量。这类做法非常有效,但是其缺点是当你舍弃一部分特征变量时,你也舍弃了问题中的一些信息。例如,也许所有的特征变量对于预测房价都是有用的,我们实际上并不想舍弃一些信息或者说舍弃这些特征变量。
方法二:正则化
正则化中我们将保留所有的特征变量,但是会减小特征变量的数量级(参数数值的大小θ(j))。
这个方法非常有效,当我们有很多特征变量时,其中每一个变量都能对预测产生一点影响。正如我们在房价预测的例子中看到的那样,我们可以有很多特征变量,其中每一个变量都是有用的,因此我们不希望把它们删掉,这就导致了正则化概念的发生。
接下来我们会讨论怎样应用正则化和什么叫做正则化均值,然后将开始讨论怎样使用正则化来使学习算法正常工作,并避免过拟合。
阅读全文
0 0
- 过拟合解决方案
- 机器学习过拟合解决方案
- 过拟合(原因、解决方案、原理)
- 过拟合(原因、解决方案、原理)
- 过拟合
- 过拟合
- 过拟合
- 过拟合
- 过拟合
- 过拟合
- 过拟合
- 过拟合
- 过拟合
- 过拟合
- 过拟合
- 过拟合
- 过拟合
- 欠拟合和过拟合
- LR11:手动关联
- Android 性能优化(一)
- Spring 5.0响应式编程
- 【Android】getX,getRawX,getWidth,getTranslationX等的区别
- Spotlight1 一词多义(Polysemy)
- 过拟合解决方案
- 23. 多态性(虚函数)
- 手游外挂入侵(一)某助手加速器实现原理探究
- java 中split 特殊符号处理
- 数据结构实验之排序二:交换排序
- 深度学习: AlexNet 网络
- 【章节4】数据表的查看、修改和删除
- Android研究_Hardware Composer_3 Vsync
- CentOS6.5 Sublime注册码