生成对抗网络GAN(二) 语音相关
来源:互联网 发布:淘宝店铺详情页装修 编辑:程序博客网 时间:2024/06/05 14:42
多任务对抗学习[1]
为了获得对噪音的鲁棒性,引入多任务学习,分为三个网络:
- 输入网络(绿色),用作特征提取器
- senone输出网络(红色),用作senone分类
- domain输出网络(蓝色),domain这里指噪音的类型,总共17种噪声
为了增加对噪音的鲁棒性,增加了GRL层(gradient reversal layer),网络在反向传播的时候,对于domain网络过来的梯度取了
[2]和[1]的思想类似。
SEGAN[3]
主要用来做语音增强(比如降噪)等。
结合conditional GAN和LSGAN,使用
一些参数的含义如下:
训练流程如下:
训练的时候需要clean speech和noisy speech的pair,以保证在去除噪声的同时保留原始语音的信息。
参考文献
[1].Adversarial Multi-task Learning of Deep Neural Networks for Robust Speech Recognition
[2].Invariant Representations for Noisy Speech Recognition
[3].SEGAN: Speech Enhancement Generative Adversarial Network
阅读全文
0 0
- 生成对抗网络GAN(二) 语音相关
- 生成对抗网络(GAN)
- 生成对抗网络GAN
- GAN生成对抗网络
- 生成对抗网络-GAN
- Gan 生成对抗网络
- [生成对抗网络] GAN
- 生成对抗网络(GAN)
- 生成式对抗网络GAN研究进展(二)——原始GAN
- 生成式对抗网络(GAN)资源
- 贝叶斯生成对抗网络(GAN)
- 生成对抗网络(GAN)初探
- 7 什么是GAN(生成对抗网络)?
- GAN对抗网络相关资源
- GAN对抗网络相关资源
- 了解生成对抗网络GAN
- 浅谈GAN生成对抗网络
- pytorch GAN生成对抗网络
- Visual Studio当前不会命中断点,还没有为该文档加载任何符号解决方法
- easyui tree js分析
- 学习之路上的小知识
- python time模块
- 学习笔记-利用Gradient Checking检查神经网络模型
- 生成对抗网络GAN(二) 语音相关
- Java面试题全集(下)
- 软件工程(C编码实践篇)学习总结
- 利用java语言设计项目界面
- 一个脚本打比赛之SMP WEIBO 2016
- 配置git和github
- Deepin 15.4.1 安装 CPU 版 Caffe
- 6.4求所有数的平方和立方
- 求1到10,20到30,35到45的和