deep learning toolbox学习5之SAE
来源:互联网 发布:idm mac版 知乎 编辑:程序博客网 时间:2024/05/29 16:15
总结一下SAE部分,整体来说十分简单,基本就是在NN基础上改了一点东西:
首先,原来的训练过程是一个监督过程,即最后计算loss的时候是有train_y与f(wx+b)的差值来进行判断,而深度学习本身自学习或非监督学习能力很强,这里就是采用的非监督学习,autoencoder就是要通过x训练一个网络最后输出还是x,即f(x)=x,在toolbox中,只是最简单的三层网络784-100-784,即hidden层有100的神经元,最后在hidden层基础上重构出x,这里的hidden层的部分作用相当于压缩数据维度,其效果和PCA很像。
整体过程和NN一样,实验效果是对比了AE训练的err和用训练完的W去初始化一个NN来进行训练,AE花费20s,err为10,而用w去初始化后的NN花费2s,err为0.15,效果提升很多。
这里加入几个trick项
1.denoising 项,在输入数据上加入噪声,具体实现很简单通过生成的随机矩阵和denoising阀值去决定输入x是否被置为0,这样训练的网络更加鲁棒
2.sparse约束,即限制神经元在大部分情况下不被激活,即隐含层节点输出的平均值应尽量为0,这里需要为损失函数添加sparse项,对应的bp过程的残差项也要加入sparse项,其数学变化主要由KL距离为展开进行计算,具体可参考博客http://www.cnblogs.com/tornadomeet/archive/2013/03/19/2970101.html
首先,原来的训练过程是一个监督过程,即最后计算loss的时候是有train_y与f(wx+b)的差值来进行判断,而深度学习本身自学习或非监督学习能力很强,这里就是采用的非监督学习,autoencoder就是要通过x训练一个网络最后输出还是x,即f(x)=x,在toolbox中,只是最简单的三层网络784-100-784,即hidden层有100的神经元,最后在hidden层基础上重构出x,这里的hidden层的部分作用相当于压缩数据维度,其效果和PCA很像。
整体过程和NN一样,实验效果是对比了AE训练的err和用训练完的W去初始化一个NN来进行训练,AE花费20s,err为10,而用w去初始化后的NN花费2s,err为0.15,效果提升很多。
这里加入几个trick项
1.denoising 项,在输入数据上加入噪声,具体实现很简单通过生成的随机矩阵和denoising阀值去决定输入x是否被置为0,这样训练的网络更加鲁棒
2.sparse约束,即限制神经元在大部分情况下不被激活,即隐含层节点输出的平均值应尽量为0,这里需要为损失函数添加sparse项,对应的bp过程的残差项也要加入sparse项,其数学变化主要由KL距离为展开进行计算,具体可参考博客http://www.cnblogs.com/tornadomeet/archive/2013/03/19/2970101.html
0 0
- deep learning toolbox学习5之SAE
- deep learning toolbox学习4之CNN
- deep learning toolbox学习使用2之NN
- deep learning toolbox学习使用3之DBN
- matlab的Deep Learning的toolbox 中的SAE算法
- Deep Learning 学习 Toolbox学习记录二 稀疏自编码器
- Deep Learning学习 之 Deep learning简介
- Matlab深度学习笔记——安装deep learning toolbox
- deep learning 之学习路线
- Deep Learning学习 之 Deep Learning训练过程
- Deep Learning 学习 Toolbox学习记录一 CNN例子的学习理解
- deep leaning toolbox学习使用1之NN
- 浅析SAE与DBM(Deep Learning)
- deep learning---SAE(stacked autoencoder)
- 机器学习之深度学习(Deep Learning)
- 【面向代码】学习 Deep Learning(四) Stacked Auto-Encoders(SAE)
- 【面向代码】学习 Deep Learning(四) Stacked Auto-Encoders(SAE)
- 【面向代码】学习 Deep Learning(四) Stacked Auto-Encoders(SAE)
- 2200亿迷案:谁泄露了腾讯入股京东?
- 如何在Android应用中加入广告
- HANA License invalid or expired
- 出成绩了。。
- Linux线程-互斥锁pthread_mutex_t应用
- deep learning toolbox学习5之SAE
- java异常分类
- Linux 按照时间查找文件
- Linux 下监控程序 -- 共享内存通讯,消息订阅发布
- java线程(2)
- 怎样写网站QQ客服代码
- 登录错误:尝试向URI“http://localhost:61130/UserService.asmx”……跨域策略……解决办法
- 四位科研牛人介绍的文献阅读经验
- 约束延迟