语音识别的一些概念

来源：互联网发布：无损鉴别软件编辑：程序博客网时间：2024/05/16 07:40

最近发现台湾的陈老师的语音识别课程主页，里面有很多课程，现在把课程主页贴在这里，大家可以去看看。

主页：http://berlin.csie.ntnu.edu.tw/Courses/Speech%20Recognition/Speech%20Recognition_Main_2013F.htm

第一个概念是上次在一个群里有人问到的。就是上下文相关和上下文无关的音素。截个图大家看下就会明白吧。

解释下:

通常都是一个词，然后我们都把它对应成音素，最简单的就是单音素，不考虑上下文。当然这种带来的效果就不好。人们就想到用三音素来解决，得到的效果就好点。最后一个是因为在实际的计算中，我们为了减少计算量而做的一种聚类，把相同发音的音素都聚成一个类。

第二个概念是之前在深度学习的论文中经常出现的。是senone，就是我们之前说的聚类中的一个类。

先看到这几个概念。后面的有就再继续补充。

0 0