Logistic回归原理介绍

来源：互联网发布：英雄无敌3 mac 10.10 编辑：程序博客网时间：2024/06/08 17:40

模型假设

根据线性回归可以预测连续的值，对于分类问题，我们需要输出0或者1。所以，在分类模型中需要将连续值转换为离散值。我们可以预测:

Logistic回归模型的输出变量范围始终在0和1之间，Logistic回归模型的假设为：

h θ (x) = g (θ T x)

其中：

g (z) = 1 1 + e - z

该函数的图像为：

所以，整个模型的假设为：

h θ (x) = 1 1 + e - θ T x

该假设函数hθ(x)的作用是，对于给定的输入变量，根据已经训练好的模型参数计算出输出变量=1的可能性（estimated probability），即

h θ (x) = P (y = 1 | x; θ)

在Logistic回归中，我们预测：

根据上面绘制的S形函数图象，当

其中，z=θTx,即：

可以观察到z=θTx与线性回归非常相似，该函数所表示的线（面）就是Logistic回归中分界线，即判定边界（Decision Boundary）。针对不同的数据分布，我们可以用非常复杂的模型来适应形状判定边界。

在线性回归中，我们将代价函数定义为模型所有误差的平方和。而在逻辑回归中沿用这个定义得到的代价函数是一个非凸函数，这难以用梯度下降法求局部最小值，因此需重新定义逻辑回归的代价函数：

J (θ) = 1 m \sum i = 1 m C o s t (h θ (x (i)), y (i))

其中Cost()函数定义为：

C o s t (h θ (x), y) = {- l o g (h θ (x)) - l o g (1 - h θ (x)) y = 1 y = 0

将构建的Cost()函数简化如下：

C o s t (h θ (x), y) = - y l o g (h θ (x)) - (1 - y) l o g (1 - h θ (x))

带入代价函数可得到代价函数表达式为：

J (θ) = - 1 m [\sum i = 1 m y (i) l o g (h θ (x (i))) + (1 - y (i)) l o g (1 - h θ (x (i)))]

仍然采用梯度下降法求代价函数的局部最小值：

θ j : = θ j - α \partial \partial θ j J (θ)

求导后得到迭代过程：

θ j : = θ j - α \sum i = 1 m (h θ (x (i) - y (i)) x (i) j

Simultaneously update θj for j=0,1…n.

注：虽然得到的梯度下降算法表面上看去与线性回归一样，但是这里的hθ(x)=g(θTx)与线性回归中不同，所以实际上是不一样的。
另外，在运行梯度下降算法之前，进行特征缩放依旧是非常必要的。

0 0