语音识别的一些概念

来源:互联网 发布:无损鉴别软件 编辑:程序博客网 时间:2024/05/16 07:40

最近发现台湾的陈老师的语音识别课程主页,里面有很多课程,现在把课程主页贴在这里,大家可以去看看。

主页:http://berlin.csie.ntnu.edu.tw/Courses/Speech%20Recognition/Speech%20Recognition_Main_2013F.htm

第一个概念是上次在一个群里有人问到的。就是上下文相关和上下文无关的音素。截个图大家看下就会明白吧。


解释下:

通常都是一个词,然后我们都把它对应成音素,最简单的就是单音素,不考虑上下文。当然这种带来的效果就不好。人们就想到用三音素来解决,得到的效果就好点。最后一个是因为在实际的计算中,我们为了减少计算量而做的一种聚类,把相同发音的音素都聚成一个类。


第二个概念是之前在深度学习的论文中经常出现的。是senone,就是我们之前说的聚类中的一个类。



先看到这几个概念。后面的有就再继续补充。


0 0