softmax函数及其性质
来源:互联网 发布:苹果电脑数据恢复 编辑:程序博客网 时间:2024/04/29 08:07
本文讨论机器学习中常见的softmax函数,并推导了softmax函数的梯度,讨论了softmax函数的一些基本性质。
softmax函数定义为
可以认为是先对
然而,上式中存在“冗余”,可以参考UFLDL中关于softmax的相关描述。
Softmax regression has an unusual property that it has a “redundant” set of parameters
这是因为
sigmoid函数是softmax函数在
sigmoid函数经常用于二元回归问题,而softmax则可以应用于多元回归,可以认为softmax函数是sigmoid函数的推广。
下面推导softmax函数的导数
为简化推导过程,令归一化参数
最后的结果很优雅,写成向量形式:
可以发现,这个和sigmoid函数的导数计算公式相似:
这也不难理解:前面已经说过,sigmoid函数视为softmax的一种特例,所以二者本来就应该有相似的形式。
推导出softmax函数的导数之后,对含有sigmoid函数的目标函数求导也就很容易了。
J1=h ∂J1∂x=h(x)(1−h(x)) J2=12h2 ∂J2∂x=h2(x)(1−h(x)) J3=hlog(h) ∂J3∂x=(1+logh(x))h(x)(1−h(x)) J4=ylog(h) ∂J4∂x=y(1−h(x))
实际中常用的是
1 0
- softmax函数及其性质
- 抽象函数及其性质
- 对数函数及其性质
- 取整函数及其性质
- 欧拉函数及其性质
- Softmax 函数及其作用(含推导)
- Softmax 函数及其作用(含推导)
- Softmax 函数及其作用(含推导)
- 通俗详解softmax函数及其求导过程
- 欧拉函数及其部分性质
- 欧拉函数及其部分性质
- 欧拉函数及其部分性质和筛法打欧拉函数表
- softmax 函数
- softmax 函数
- Softmax函数
- softmax函数
- softmax 函数
- softmax函数
- 【zzuliOJ】1922 - 棋子问题(bfs & 位运算)
- iOS 第三方框架大全
- Java知识点14
- 51 nod1051 最大子矩阵和
- C# 匿名对象的写法
- softmax函数及其性质
- android绘图原理
- Spring Boot 部署与服务配置
- STM32 CAN应用-过滤器设置
- laravel5.2 创建资源控制器
- java之异常处理
- 二维码的 扫描和生成
- C#中timer类的用法
- [bzoj4373]算术天才⑨与等差数列