程序博客网 > 网络的发展趋势

机器学习第三章复习（4）

来源：互联网发布：网络的发展趋势编辑：程序博客网时间：2024/06/03 16:00

本文用于复习《Machine Learning》第三章部分内容

内容来自于Andrew Ng的机器学习课程，主要是为了回忆起来方便

第三章最后部分主要讲解了如何解决欠拟合过拟合

注：博客中图片均来自于课程

underfit & overfit

这里写图片描述

underfit解决方法
underfit也叫“high bias”，可能是特征量太少引起了欠拟合。
解决办法：
1.可以增加特征；
2.调整特征的幂次（mapfeatures），即是说如果只有两个特征x1，x2，利用mapfeatures可以把他们扩展成x21,x1x2,x22诸如此类。
overfit解决方法
overfit也叫“high variance”，可能是特征量太多引起了过拟合。
解决办法：
1.手动选择一些比较重要的特征量；
2.仍然运用所有特征量，但是调整特征量对应的θj,改变不同特征值对预测函数的影响。

举例

例如右图所示θ0+θ1x+θ2x2+θ3x3+θ4x4
此时，想办法使得θ3、θ4值接近于0，那么
θ0+θ1x+θ2x2+θ3x3+θ4x4就会接近于θ0+θ1x+θ2x2
也就是中间的那张图

regularization
如何实现使得θ3、θ4值接近于0呢？
利用正则化
$J (θ) = 1 2 m \sum i = 1 m (h θ (x (i)) - y (i)) 2 + λ \sum j = 1 n θ 2 j$
把θj放到代价方程里面，就可以把θj适当缩小
Gradient descent如下：
$θ 0 : = θ 0 - α \partial \partial θ 0 J (θ)$
$θ j : = θ j - α [\partial \partial θ j J (θ) + λ m θ j]$
$\partial \partial θ j J (θ) = 1 m \sum i = 1 m (h θ (x (i)) - y (i)) x (i) j$
Normal Equation如下
$θ = （ X T X + λ ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ 00000 01 . . . 00 0 . . . 1 . . . 0 00 . . . 10 00001 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟ ） - 1 X T y$
同时由于加上了
$⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ 00000 01 . . . 00 0 . . . 1 . . . 0 00 . . . 10 00001 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟$
m小于n时可能遇到的矩阵不可逆的问题也得到了解决

0 0

网络的发展趋势

网络的发展趋势

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子山水诗开创者王维的山水诗写山水的诗山水之间歌词爱在山水间山水之间吉他谱桂林山水间门票价格山水间门票在乎山水之间也上一句山水之间的唯美句子桂林山水间表演云南大理山水间大理山水间杜达雄经典摄影桂林山水间山江山沟沟山沟沟风景区杭州山沟沟风景名胜区回到山沟沟山沟沟游玩走出山沟沟言开山沟沟酒店山沟沟门票走出山沟沟山沟沟茅塘农庄山沟沟酒店武陵源山沟沟酒店杭州山沟沟风景区余杭山沟沟景区旅游山沟沟农家乐山沟沟二日游山沟沟一日游山沟沟农家乐山沟沟一日游报价山沟沟怎么样山沟沟住宿山沟沟景点金志文山沟沟山沟沟金志文山沟沟景区好玩吗山沟沟好玩吗