Stanford机器学习-Linear Regressioon with One Variable(1)

来源:互联网 发布:在家兼职淘宝客服58 编辑:程序博客网 时间:2024/05/13 14:55

模型代表(Model representatino)

之前大体上学习了关于机器学习的一些总体的内容,接下来开始学习有关机器学习一些经典的算法,第一个学习的是:回归算法

下面我们还用房屋价格的例子来学习:
这里写图片描述

坐标图中横轴表示的是房屋的面积大小,纵坐标表示的是价格,坐标图中已经描出了一系列的点,也就是我们现有的真实的数据。我们现在要做的就是寻找一条合适的回归曲线,使得可以更好的拟合现有的数据。如图所示,现在画出了一条粉色的直线和一条蓝色的曲线,此时给定一定的房屋面积来预测相应的价格,得出的结果是不同的,但那个更加接近真实的情况,还不清楚。

这就是一个有监督的学习的例子,我们就是要给出每个数据对应的“正确的答案”,同样也是一个回归问题,就是说我们要根据已有的数据来预测出一个准确的输出值,这里指价格。此外还有一种有监督的学习便是分类,即预测离散的输出值。

下面我们用房屋的价格做我们的训练集,如下所示:
这里写图片描述

其中的符号意义如下:
这里写图片描述

具体的数据表示如蓝色部分所写,在学习之前我们就需要搞清楚符号所代表的东西。那么我们是通过训练集如何得到一个预测的输出呢?如下:
这里写图片描述

我们把准备好的训练集投给我们的学习算法,结果便得到一个函数,记为h,即假设(hypothesis),我们将输入数据(房屋的面积)带入函数便可以得到想要的输出(价格)。我们该如何来表达h呢?一种表达方式为这里写图片描述 ,也就是一条倾斜的直线,这里因为只有X一个变量,因此此算法也叫单变量线性回归算法。

0 0