Andrew Ng-ML-第一讲

来源:互联网 发布:电脑编织机编程 编辑:程序博客网 时间:2024/05/22 06:23

此系列课程来自Coursera


一、概念介绍

1、监督学习:把已知X和Y的数据集输入到算法模型中,来调整算法模型中参数,使得后续输入X数据时可以得到理想的Y。

2、无监督学习:分类未被标记的样本集。


二、Linear Regression with one Variable 只有一个变量的线性回归

从一个例子入手:



例子的意思是我们有一个Training Set 数据集,是房屋面积和房屋价格的对应关系集,我们要用这个数据集来得到一个算法模型,让这个算法模型能根据房屋面积来预测房屋价格。

好吧 我们就使用最简单的算法模型:y = theta0+theta1x;其中x代表房屋面积,y代表房屋价格。


现在我们要做的就是算出theta0和theta1。有了theta0和theta1,我们就能根据x来得到y了。


上图就是用来计算theta0和theta1的思路:

大致意思是我们先把数据集的x,y的对应关系画到图上,就是上面的红叉叉,而我们要求的函数就是那条蓝线了,这条蓝线的位置要尽量的拟合这些红叉叉,那就是求上面的J函数的极小值。



上图是使用梯度下降法来计算极小值:

大致意思是在J函数里我们对theta0和theta1分别求偏导,然后用当前(第一次的时候是默认的theta0和theta1)的theta0和theta1减去求出来的偏导数来得到新的theta0和theta1,把新的theta0和theta1带入到J函数中算出J值,如果这一次算出来的J值和用上一次的theta0和theta1算出来的J值相差比较大,就说明没有拟合,就继续拿算出来的theta0和theta1分别减去最新的偏导数来得到最新的theta0和theta1,直到这次算出来的J值和上次算出来的J值相差非常小,就说明拟合了,那这就是我们要找的theta0和theta1啦。


这时候你就可以拿房屋的面积输入到这个函数中,获得理想的房屋价格。






0 0
原创粉丝点击