（二）Logistic Regression[逻辑回归]&正则项

来源：互联网发布：淘宝家居排行榜编辑：程序博客网时间：2024/06/05 20:56

逻辑回归解决的是分类问题，它的本质是给了X,y，来求解θ，和线性回归很像。逻辑回归也是Xθ进行预测，预测的值可以理解为概率，在0~1之间，比如可以将>0.5的值归为1，<0.5的归为0。
总之，逻辑回归和线性回归都是为了得到θ(θ是个香饽饽~)，得到了之后，一个用来分类，一个用来预测。下面详解。

逻辑回归

比如打算把一群sample分成2类，分别用0,1代表负样本和正样本，即y⊂{0, 1}，那么之前的h(x)就显得不那么合适了，因为他可能会得到任意值，为了使h(x)⊂[0,1]，就需要对它进行变形。
令h(x)=g(θTx)=11+e−θTx，其中g(x)如下图所示：
这里写图片描述
这样，h(x)就回到了[0，1]之间，就可以用差的平方计算J(θ)，如下
J(θ)=1m∑mi=112(hθ(x(i))−y(i))2(1)
但是由于新的h(x)的原因，J(θ)是非凸函数（左下图），我们想得到凸函数（右下图）：

这样梯度下降很可能落到局部最优点中。
为了解决这个问题，我们将J(θ)变成
这里写图片描述
意义如下图所示：

就是说，如果预测了1但结果是0，就会有很大的代价，造成J(θ)很大；另一种情况同理。
我们知道，我们的目的是为了通过θ的变化让J变得尽量小，所以梯度下降的新θ如下所示，这里其实是整个算法的核心。
这里写图片描述
这里我没有仔细推公式，有怀疑利用新的J(θ)得到的θ的梯度真的张这个样子？因为如果终止条件是迭代次数的话，最最重要的就是θ的变化。