coursera《机器学习》吴恩达-week1-02 单一变量的线性回归

来源：互联网发布：如何制作淘宝水印编辑：程序博客网时间：2024/06/06 08:29

线性回归根据输入值预测实值输出。我们讨论线性回归在房价预测中的应用，提出了成本函数的概念，并介绍了梯度下降法的学习方法。

模型和代价函数

这里写图片描述

这里写图片描述

一个成本函数可以让我们找出如何使我们的数据符合最好的直线
可供选择的值θi（参数）
- 不同的值给你不同的功能
- 如果 θ0是1.5和 θ1是0，那么我们得到平行X轴的直线，y坐标恒为1.5
- 如果 θ1> 0，我们得到了一个正斜率
根据我们的训练集，我们要生成直线的参数
选择这些参数，以便 hθ(x)的值接近我们的训练样例的Y值
- 基本上，使用训练集中的多个X值输入h(x)，使输出尽可能的接近于实际的Y值(X值实际对应的数据）
  -想象hθ(X)是“Y模仿者” -它试图将X转化为Y，并考虑到我们已经有了实际的Y,我们可以评估hθ(X)效果如何
-形式化过程
- 我们想要解决最小化问题
- Minimize (hθ(x) - y)2
- 即最小化每个/任何/每个示例的 h(x)和y之间的差异
- 在训练集上求和每个差异
最小化预测房价与实际房价之间的平方差
- 1 / 2M
  - 1/m- 表示我们确定平均值
  - 1/2m使数学有点简单，并且不改变我们确定的常数（即最小值的一半仍然是最小值！）
- 最小化θ0/θ1意味着θ0、θ1的值可以使得x的线性回归值与y的平均偏差最小。
更简单地说，这是一个代价函数

这里写图片描述

假设你熟悉轮廓图或轮廓图
- 使用相同的成本函数，假设和目标如前所述
- 如果您不了解 cotour plots，可以跳过本节的部分内容
使用我们原来的复杂的假设函数与两个变量参数，
- 所以成本函数是
  - J(θ0, θ1)
例如,
- 假定：
  - θ0 = 50
  - θ1 = 0.06
- 以前，我们通过绘图绘制了成本函数
  - θ1 vs J(θ1)
- 现在我们有2个参数
  - 绘制变得更加复杂
  - 生成一个所在轴的3D曲面
    - X = θ1
    - Z = θ0
    - Y = J(θ0,θ1)
我们可以看到，height (y)表示成本函数的值，因此找到y在最小值的位置
我们可以使用轮廓数字/曲线来代替曲面图
- 以不同颜色设置椭圆
- 每种颜色为J(θ0, θ1)，但显然打印到不同的位置，因为θ0和θ1将变化
- 想象一下碗状函数从屏幕出来，所以中间是同心圆
每个点（像上面的红色）代表Ɵ0和 Ɵ1的一对参数值
- 我们的例子在这里选定参数：
  - θ0 = ~800
  - θ1 = ~-0.15
- 不适合
  - 这些参数给出了远离轮廓图上的中心的值
- 如采用：
  - θ0 = ~360
  - θ1 = 0
  - 这给了一个更好的假设，但仍然不是很好 - 不是在轮廓图的中心
- 最后我们找到最小值，给出最佳假设
通过眼睛/手做这个是令人憎恨的
- 我们真正需要的是一个高效的算法往复查找了不同的θ0和θ1对应的最小值

阅读全文

0 0