分类-2-softmax

来源:互联网 发布:免费图文识别软件 编辑:程序博客网 时间:2024/04/29 06:23

softmax是一个可以解决多分类问题的方法。
y{1,2,...,k},即共有k个类别,而不是之前的二分类问题。
此时我们使用ϕ1,...,ϕk来表示输出,即样本属于每个类别的概率。显然对于任意的一个样本有ϕ1+...+ϕk=1,故ϕk可由其他ϕ。这样我们只需要k-1个ϕ
定义T(y)如下:
这里写图片描述
(T(y))iT(y)iI{something}I{true}=1,I{false}=0,I{2=3}=0
因此可以得到:(T(y))i=I{y=i}E[(T(y))i]=P(y=i)=ϕi.
注:训练过程中样本的类别是已知的,即在T(y)中必然只有一个元素为1,其余全部是0.
因此可得:
这里写图片描述
显然ηi=logϕiϕk,为了方便我们定义ηk=log(ϕkϕk)=0
显然我们可以得到:
这里写图片描述
进而得到ϕk=1ki=1eηi,ϕkeηi=ϕiϕi=eηikj=1eηj,这里用到了ηi=θTix(i=1,...,k1)
因此:
这里写图片描述
这样就可以得到hθ(x):
这里写图片描述
为了确定参数θ我们类似之前的处理,求最大似然值:
由:
这里写图片描述
知:我们可以通过梯度上升或者牛顿迭代求解啦。

0 0
原创粉丝点击