程序博客网 > 和风天气 json解析 js

深度学习7softmax回归

来源：互联网发布：和风天气 json解析 js 编辑：程序博客网时间：2024/06/05 10:34

softmax回归可以解决两种以上的分类，该模型是logistic回归模型在分类问题上的推广。

对于y可以取两个以上的值，比如说判断一份邮件是垃圾邮件、个人邮件还是工作邮件。

这边也参考http://deeplearning.stanford.edu/wiki/index.php/Softmax%E5%9B%9E%E5%BD%92

即，对于训练集，我们有

也就是对于给定的输入x，我们想用假设函数针对每一个类别j估算p(y=j|x)，也就是估算出每一种分类结果出现的概率。对于logistic回归中，y取0跟1，我们采用假设函数 clip_image009 我们将训练模型参数，使其能够最小化代价函数：

就是这边为什么乘以-1/m

而在softmax回归中，y取多个值k，因此，我们的假设函数将要输出一个维的向量（向量元素的和为1）来表示这个估计的概率值。具体地说，我们的假设函数形式如下：

clip_image014

下面就看看这个是怎么来的。

首先定义每个结果的概率，

则有，这样我也就可以把最后一个概率用前面几项表示，即

则，这个问题我们可以看成事k-1维的问题。则这个时候的T(y)就不是y，而是一组k-1维的向量，也就是T(y)要给出每一个y=i的概率（i从1到k-1）对于这个问题也演化到一般线性模型上面，即

将这多个向量也转化到指数分布上。下面定义:

clip_image022

用表示第i个向量，第i为1，其他为0，符号表示

，

另外我们有

好，下面我们的目的也就是使得每个在其i时的概率最大，转化到一般线性模型下，即

clip_image034

则：

clip_image036

则对于每一个有

clip_image040 这边，接着有

clip_image044

则，带入得到

clip_image048

从η到φ我们就叫做softmax回归。

这样我们就得到了上面的假设函数，换个写法

clip_image050

下面再反过来求最大似然估计

clip_image052

最后我们再用牛顿法或者梯度下降法解出θ

整个过程有了，但是还没有能够进行深入理解，对于更多细节参考

http://deeplearning.stanford.edu/wiki/index.php/Softmax%E5%9B%9E%E5%BD%92

下面做一下这个后面的练习来加深理解。

0 0

和风天气 json解析 js

和风天气 json解析 js

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子余姓起名余姓的来源余姓男孩起名姓余的名人余姓男孩取名98分以上女孩姓余取什么名字好姓余的女孩名字余姓有诗意的名字家住西泠余姓苏姓余女孩名字大全余姓男孩名姓余的男孩名字超好听姓余的男孩子名字大全姓余的男孩名字大全余姓男孩取名100分 2018年余姓女宝宝清新脱俗名字余姓男孩取名字余姓跟什么姓不能通婚姓余女孩名字好听时尚余姓女孩取名男孩姓余取什么名字好余姓取名姓余 2018年好听得余姓男孩名字大全宁波余姚余姚生活余姚余姚论坛余姚人才网余姚市余姚人才余姚论坛关注余姚余姚英才网余姚二手房浙江余姚关注余姚余姚房产网余姚景点余姚论坛网余姚网余姚房价