线性模型

来源：互联网发布：godaddy域名转移编辑：程序博客网时间：2024/05/16 00:36

逻辑回归

逻辑回归是一种非常流行且高效的分类器，它不仅可以预测样本的分类，还可以计算出分类的概率信息。

假设有n个训练样本(x1,...xn),xi是d维向量，其类别标签是y1,y2,...,yn.对于一个c类问题，yi∈{1,2,...,c}.
Logistic回归学习这样一个函数

f (x) = g (θ T x) = 1 1 + e - θ T x (1)

其中

g (z) = 1 1 + e - z (2)

被称为Logistic函数或者Sigmoid函数
我们先考虑二分类问题,设

P (y = 1 | x, θ) = f (x) (3)

即对于给定的样本

x，其属于类别

1的概率是

f(x)。则属于类别

0的概率是

P (y = 0 | x, θ) = 1 - f (x) (4)

上述概率也可以写作

P (y | x, θ) = f (x) y (1 - f (x)) 1 - y (5)

Logistic回归具有如下特点，一个事件发生的几率（odds）定义为事件发生的概率与不发生概率的比值。设

p=P(y=1|x,θ),那么事件的几率是

p1−p,其对数函数是

l o g p 1 - p = l o g P ( y = 1 | x , θ ) 1 - P ( y = 1 | x , θ ) = θ x (6)

可以看出，输出类别

1的对数几率是输入

x的线性函数。
此外，后验概率也可以写作如下形式：

P (y = 1 | x, θ) = e θ T x 1 + e θ T x

P (y = 0 | x, θ) = 1 1 + e θ T x (7)

以下使用极大似然估计方法来求解参数，参数

θ的似然函数是：

L (θ) = \prod i = 1 n P (y i | x i, θ)

= L (θ) \prod i = 1 n f (x i) y i (1 - f (x i)) 1 - y i (8)

最大化似然函数往往比较困难，可以通过最大化对数似然函数来求解。

θ的对数似然函数是：

ℓ (θ) = l o g L (θ) = l o g \prod i = 1 n f (x i) y i (1 - f (x i)) 1 - y i = \sum i = 1 n l o g f (x i) y i (1 - f (x i)) 1 - y i = \sum i = 1 n y i l o g (f (x i)) + (1 - y i) l o g (1 - f (x i))

实际上，代价函数的形式是：

J (θ) = - 1 n \sum i = 1 n y i l o g (f (x i)) + (1 - y i) l o g (1 - f (x i)) (10)

所以最小化代价函数就等价于最大化似然估计。
可以通过梯度下降法来求解

ℓ(θ)的极大值。即

θ : = θ + α \nabla θ ℓ (θ) (11)

\partial \partial θ j ℓ (θ) = \partial \partial θ j \sum i = 1 n y i l o g (g (θ T x i) + (1 - y i) l o g (1 - g (θ T x i))

= \sum i = 1 n (y i - f (x i)) x (j) i (12)

x(j)i是第

i个样本的第

j个特征。
所以，对于参数

θ向量中的任一元素

θj，迭代方式如下：

θ : = θ + α \sum i = 1 n (y i - f (x i)) x (j) i (13)

如此，就可以将全部参数求出。
还可以使用牛顿等迭代方法来求出。

阅读全文

0 0