Logistic回归

来源：互联网发布：小智淘宝店叫什么编辑：程序博客网时间：2024/06/15 19:58

逻辑回归

逻辑回归可以用来进行回归与分类，两者仅有略微不同，主体算法是一样的，本文以分类进行讲解。如下图二分类问题，我们希望找到一个直线（高维空间为超平面）来将数据划分开。
这里写图片描述
这样的线性边界可以表示为：θ0x1+θ1x2+...+θmxm=θTx
上式右边x为向量。
我们取预测函数为Sigmoid函数，Sigmoid函数有一个很棒的特点是它的导数f′(x)=f(x)(1−f(x))
则预测函数可表示为：

P (y = 1 | x; θ) = h θ (x)

P (y = 0 | x; θ) = 1 - h θ (x)

将这两个式子合并一下：

P (y | x; θ) = (h θ (x)) y (1 - h θ (x)) 1 - y

显然：
当y=0的时候上式等价于

P(y=0|x;θ)=1−hθ(x)
当y=1的时候上式等价于

P(y=1|x;θ)=hθ(x)

取似然函数L(θ)=∏mi=1(hθ(x(i)))yi(1−hθ(x(i)))1−yi
我们的目的就是求解似然函数的最大值，为了方便求解，我们取对数似然函数如下：

l o g L (θ) = \sum i = 1 m (y i l o g h θ (x (i)) + (1 - y i) l o g (1 - h θ (x (i))))

如此，我们就可以使用如下的式子进行梯度上升算法迭代更新θ的取值：

θ j = θ j + α \partial l o g L ( θ ) ) \partial θ j

下面求解

∂logL(θ))∂θ

\partial l o g L ( θ ) ) \partial θ j = \sum i = 1 m (y i 1 h θ ( x ( i ) ) + (1 - y i) 1 1 - h θ ( x ( i ) )) \partial h θ ( x ( i ) ) \partial θ j

= \sum i = 1 m (y i 1 g ( θ T x ( i ) ) + (1 - y i) 1 1 - g ( θ T x ( i ) )) g (θ T x (i)) (1 - g (θ T x (i))) x (i)

= \sum i = 1 m (y i (1 - g (θ T x (i))) - (1 - y i) g (θ T x (i))) x (i)

= \sum i = 1 m (y i - g (θ T x (i))) x (i)

= \sum i = 1 m (y i - h θ (x (i))) x (i)

所以权重的迭代更新式为（最后一项xi应加上下标j）：

θ j = θ j + α \sum i = 1 m (y i - h θ (x (i))) x (i)

其中

α为更新率

梯度上升

有了以上的逻辑回归的理论基础，下面我们编程实现这一步骤。就以第一张图的样本为例进行，样本维数为2维，采用梯度上升算法进行迭代。
迭代步数自己选择

批量梯度上升
批量梯度上升每进行一次迭代更新就会计算所有样本，因此得到的模型正确率比较高，但同时计算复杂度高，算法耗时。计算过程如下：
1.首先根据权重和训练样本计算估计值

h = ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ x (1) 1 x (2) 1 . . . x (m) 1 x (1) 2 x (2) 2 . . . x (m) 2 x (1) 3 x (2) 3 . . . x (m) 3 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟ ⎛ ⎝ ⎜ θ 1 θ 2 θ 3 ⎞ ⎠ ⎟ = ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ y 1^y 2^. . . y m^⎞ ⎠ ⎟ ⎟ ⎟ ⎟

2.计算误差

e r r o r = y - y^= ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ y 1 y 2 . . . y m ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ - ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ y 1^y 2^. . . y m^⎞ ⎠ ⎟ ⎟ ⎟ ⎟ = ⎛ ⎝ ⎜ ⎜ ⎜ e 1 e 2 . . . e m ⎞ ⎠ ⎟ ⎟ ⎟

3.迭代更新

w = w + ⎛ ⎝ ⎜ ⎜ ⎜ x (1) 1 x (1) 2 x (1) 3 x (2) 1 x (2) 2 x (2) 3 . . . . . . . . . x (m) 1 x (m) 2 x (m) 3 ⎞ ⎠ ⎟ ⎟ ⎟ ⎛ ⎝ ⎜ ⎜ ⎜ e 1 e 2 . . . e m ⎞ ⎠ ⎟ ⎟ ⎟ \to ⎛ ⎝ ⎜ Δ θ 1 Δ θ 2 Δ θ 3 ⎞ ⎠ ⎟

随机梯度上升
根据样本数量进行迭代，每计算一个样本就进行一次更新，过程如下：
1.计算x(i)样本对应的估计值

h = (x (i) 1 x (i) 2 x (i) 3) ⎛ ⎝ ⎜ θ 1 θ 2 θ 3 ⎞ ⎠ ⎟

2.计算误差

e r r o r = y i - h (n u m b e r)

注意，此处的误差是个数，不再是个向量
3.迭代更新

w = w + α ⎛ ⎝ ⎜ ⎜ ⎜ x (i) 1 x (i) 2 x (i) 3 ⎞ ⎠ ⎟ ⎟ ⎟ e r r o r

以上步骤更新m次。

阅读全文

0 0