机器学习第一周（二）--模型引入

来源：互联网发布：coc弓箭女皇升级数据编辑：程序博客网时间：2024/06/05 18:33

假设函数Hypothesis
损失函数Cost function
梯度下降
- 学习速率
- 梯度下降应用到线性回归
- 梯度下降表达式
涉及到的计算

回顾监督学习的流程
监督学习流程

假设函数–Hypothesis

以预测房价作为问题的引入：
这里写图片描述
X轴为房子面积，Y轴为价格
这里X可看作数据的输入，也就是一个feature；Y看做输出，也就是房价。（这个例子只有一个特征）
我们要做的就是针对给定一个输入X，也就是房子面积。通过学习算法得到的最优模型也就是h来预测房子的价格。
显而易见，预测的结果与房子的真实价格越逼近越好，所以h的选择（其实就是参数theta的选择）尤为重要。
h我们称之为假设函数（也就是图中的绿线），这里我们用如下表示

损失函数–Cost function

我们用预测结果与真实价格的误差评判h的优劣。即（h-y）
我们用损失函数来表示这一结果：

要误差越小越好，当然我们要找到损失函数的全局最小值
这里写图片描述
调整参数找到损失函数的全局最小，由此引入梯度下降
（这里放上理解的关系图，画的不是十分恰当）

梯度下降

梯度下降：
梯度下降算法
α 称学习速率
j=0,1表示特征索引，应该同步更新参数θ ……（向量化表示更简单）

梯度下降示意图
X,Y轴表示θ 0和θ 1，Z轴表示损失函数
不断地改变θ 的值，最终损失函数会收敛到一个最小值位置（注意，这个最小值不一定是全局最小，有可能是局部最小，但如果损失函数是一个凸函数时，梯度下降法得到的一定是全局最优解），α 决定梯度下降的每一步，每一步下降的方向由J（theta）的偏导数决定，如当损失函数从俩个不同的位置开始下降时，得到的会是俩个不同的值（图中的俩个箭头）。