【机器学习】从贝叶斯角度理解正则化缓解过拟合
来源:互联网 发布:淘宝卖家屏蔽买家消息 编辑:程序博客网 时间:2024/05/06 19:40
从贝叶斯角度理解正则化缓解过拟合
参考: LR正则化与数据先验分布的关系? - Charles Xiao的回答 - 知乎
原始的Linear Regression
假设有若干数据
注意,这里忽略偏置,或者可以认为偏置是在
ωTx 里面。
我们将
则对于每一个数据点
注意,这里的
yi 是真实值。
如果我们想要让这个概率最大,就得到了最大似然:
取对数:
由上式可以看出,最大化对数似然,也就是最小化均方误差。即:
这样, 就从最大似然的角度解释了均方误差。
但是,如果
所以说,要环节过拟合,一方面我们可以进行特征选择,另一方面,我们可以让
对ω 引入先验分布
对ω 引入高斯先验分布
如果我们对
这样,(1)式就变为:
取对数:
n是数据的维度。
最大化对数似然函数,就等价于:
也就是说,为参数
对ω 引入拉普拉斯先验分布
如果我们对
类似上面的推导,我们可以得到:
也就是说,为参数
总结
之所以推导这些,是向给解释正则化找个理由。有了贝叶斯的这种方式,我们可以说,引入先验分布是降低了模型的复杂度,或者说是拉普拉斯分布进行了一定的特征选择,而高斯分布式对不重要的特征进行了抑制。另外,还可以说是,在
- 【机器学习】从贝叶斯角度理解正则化缓解过拟合
- 机器学习正则化与过拟合
- 机器学习关于过拟合和正则化的笔记
- 机器学习笔记05:正则化(Regularization)、过拟合(Overfitting)
- 机器学习--正则化(regularization)防止分类器过拟合
- 机器学习中防止过拟合的正则化
- 机器学习过拟合
- 机器学习过拟合
- 从贝叶斯角度深入理解正则化
- 斯坦福大学机器学习笔记——过拟合问题以及正则化的解决方法
- 【机器学习】过拟合与欠拟合
- 机器学习--欠拟合与过拟合
- 机器学习中拟合与过拟合
- 【机器学习基础】过拟合
- 机器学习防止过拟合
- 机器学习过拟合问题
- 机器学习 过拟合问题
- 【机器学习基础】过拟合
- 设计模式
- 关于进程保活问题
- c语言scanf()函数问题
- 快速排序算法
- 【口胡】【坑:对偶图】【Codeforces 671D】【JZOJ 5369】 幽雅的绽放吧,墨染之樱
- 【机器学习】从贝叶斯角度理解正则化缓解过拟合
- 流式布局
- 性能测试工具 wrk 安装与使用
- 模拟退火算法matlab求函数最大值实例
- 作业3
- 洛谷P1345 [USACO5.4]奶牛的电信Telecowmunication
- 软件测试面试题:如何测试一支签字笔
- 638. Shopping Offers
- Android Notification的基本使用和点击跳转中的注意事项