MOOC微软课程:深度神经网络在语音识别上的应用

来源:互联网 发布:矩阵乘法怎么算 编辑:程序博客网 时间:2024/05/19 16:21

一、语音识别系统应用概要
将语音识别转换成文本输出
各个模块:
1、特征提取:用信号处理手段将原始语音波形信号转换成特征矢量,常用特征有MFCC,PLP,fbank等
2、声学建模:HMM
HMM:
这里写图片描述
3、发音字典:
这里写图片描述
4、语言模型:
这里写图片描述
5、解码和搜索:预测输出
这里写图片描述
二、深层神经网络在语音识别上基本应用
深层神经网络的优点
这里写图片描述
三、深层神经网络在语音识别上进阶应用
这里写图片描述
这里写图片描述
递归神经网络
这里写图片描述
注:传统RNN使用了sigmoid函数,所以会存在梯度消失
LSTM
这里写图片描述
四、常用语音识别开源软件
这里写图片描述
这里写图片描述

阅读全文
0 0