初学logistic回归

来源：互联网发布：tcp网络调试助手编辑：程序博客网时间：2024/06/05 22:41

一、简介

假设现在有一些数据点，我们用一条直线对这些点进行拟合，这个拟合的过程就称作回归。Logistic回归的主要思想是：根据现有数据对分类边界线建立回归方式，以此进行分类。这是一个二值型输出分类器。由于需要进行距离计算，以此要求数据类型为数值型。

二、基本思想

我们想要的函数是能够接受所有的输入然后预测出类别。我们此处用的函数是Sigmoid函数，Sigmoid函数具体的计算方式如下：

当x为0时，Sigmoid函数值为0.5。随着x的增大，对应的Sigmoid函数值将逼近1；随着x的减少，对应的Sigmoid函数值将逼近0。如果横坐标刻度足够大，Sigmoid函数看起来很像一个阶跃函数。为了实现回归器，我们在每个特征上都乘以一个回归系数，然后把所有的结果值相加，将这个结果带入Sigmoid函数中，进而得到一个范围在0~1之间的数值。任何大于0.5的数据被分入1类，小于0.5的数据归入0类。所以，Logistic回归也可以被看成是一种概率估计。确定了分类器的函数形式，现在的问题变成了求回归系数。

Sigmoid函数的输入记为z，由下面公式得出：