机器学习中regularization正则化(加入weight_decay)的作用

来源:互联网 发布:c语言与或运算 编辑:程序博客网 时间:2024/05/16 10:24

Regularization in Linear Regression

转载自:http://blog.sina.com.cn/s/blog_a18c98e5010115ta.html

 

RegularizationLinear Regression中很重要的一步。

回忆一下上篇内容:

通过使用normal equation,可以找到least square regressionclose form结果:

输入是X,输出是Y

新宇教你机器学习之 <wbr>Regularization <wbr>in <wbr>Linear <wbr>Regression

另外:

Overfitting是机器学习中的一个问题。当所构建出的模型的参数个数相对的大于数据的个数的时候,就会发生overfitting举个例子,如果有一组数据,是二维空间的5个点。一个4次多项式模型就会完全的fit所有的data points(这已经不是一个好结果了)。如果模型是一个5次或者6次多项式,regression的结果就会更糟糕。因为这5个点的分布可能只是linear的。

Linear Regression里,overfitting现象发生的特点就是会带来非常大的theta值。

假设有下列linear 模型:

新宇教你机器学习之 <wbr>Regularization <wbr>in <wbr>Linear <wbr>Regression

M就是theta的个数,当模型参数过多时,theta的值就会变得很大。

 

考虑到上面因素,Regularized Regression就是在原有cost function基础上加入了对于theta值过大的惩罚。

(下面公式的符号变了一下。。W就是上面的theta。 懒得自己重新写公式了。。。)


L2-Regularization

新宇教你机器学习之 <wbr>Regularization <wbr>in <wbr>Linear <wbr>Regression

Lambda是根据个人喜好的一个惩罚参数,你想要对overfitting多惩罚一点就调大一点


微分后得到:

新宇教你机器学习之 <wbr>Regularization <wbr>in <wbr>Linear <wbr>Regression
新宇教你机器学习之 <wbr>Regularization <wbr>in <wbr>Linear <wbr>Regression

0 0
原创粉丝点击