一元线性回归

来源：互联网发布：mac 音乐编辑：程序博客网时间：2024/04/30 06:26

假设(x1,y1),（x2,y2),...,（xn,yn)是总体的n个观测值，一元线性回归的hypothesis函数:
hθ(x)=θ0+θ1x
观测值标示为估计值加误差的形式：
yi=θ0+θ1xi+ei
误差的平方和：

Q = \sum i = 1 n (y i - θ 0 - θ 1 x i) 2

最小二乘法是通过最小化Q来求θ0,θ1

求解方法1 偏导为0，Q取最小值：
求Q对于θ0,θ1的偏导：

\partial Q \partial θ 1 = - 2 \sum i = 1 n (y i - θ 0 - θ 1 x i) x i

\partial Q \partial θ 0 = - 2 \sum i = 1 n (y i - θ 0 - θ 1 x i)

偏导为0，Q取最小值得到：

θ 1 = n \sum x i y i - \sum x i \sum y i n \sum x 2 i - ( \sum x i ) 2

θ 0 = \sum x 2 i \sum y i - \sum x i \sum x i y i n \sum x 2 i - ( \sum x i ) 2

求解方法2 直观图形：
首先把所以的点都标准化

x i' = x i - μ x σ x

y i' = y i - μ y σ y

最佳直线为

y' = r x'

r=∑(xi−x¯)(yi−y¯)nσxσy为

xi与

yi的相关系数，即

y - μ y σ y ＝ r x - μ x σ x

θ 1 = r σ y σ x

θ 0 = μ y - r μ x σ y σ x

把r代入得到

θ 1 = n \sum x i y i - \sum x i \sum y i n \sum x 2 i - ( \sum x i ) 2

θ 0 = \sum x 2 i \sum y i - \sum x i \sum x i y i n \sum x 2 i - ( \sum x i ) 2

求解方法3 梯度下降：
start with some

θ0,

θ1
repeat until convergence{

θ 0 = θ 0 - a \partial Q \partial θ 0

θ 1 = θ 1 - a \partial Q \partial θ 1

}
a是步长，learning rate
hopefully we have the minimum of Q

第一种偏导为零是直接法，第三种梯度下降是迭代法，都是求误差平方和的方法。θ0,θ1的初始值，步长都影响梯度下降的结果。

1 0