sphinx4当中的语言模型工具和声学模型工具

来源：互联网发布：沪港通持股数据编辑：程序博客网时间：2024/05/21 22:50

在此网站可以看到http://www.speech.cs.cmu.edu/#resources

这两个工具的定位是不同的，SLM是用来训练大数据的，正如官方所说的，如果只是训练几百个句子，杀鸡就不用牛刀了，我们可以选择 Sphinx Knowledge Base Tool，这个工具简单，易用，你所要做的只是给他提供语料，剩下的它会帮你在线完成，这个工具同样也有两个版本，一个简易版，就是刚进去所呈现的版本，一个是高级版本Advanced Version，点击它，就会进入高级版本，高级版本比简易版多了一些设置，比如音素集选择，模型选择的，用于我只用于研究，所以会用到这个小语言工具，没有看SLM工具。记住语言模型是用来限制词的搜索范围的（语言或者语法模型当中没有的词不会出现在输出当中）。个人感觉是由模型解码出音素序列，然后在字典中查找对应的单词，最后根据语言模型从候选单词中选出需要输出的单词。（我用自己制作的词典，与用cmu的官方词典识别的结果是一样的，只是我的语言模型用的我自己的）

sphinx4的声学模型训练工具需要用到sphinxtrain以及sphinxbase，这两个资源可以在此处下载到http://sourceforge.net/projects/cmusphinx/files/，有tar.gz和*.win32.zip格式，如果下载win32.zip格式，解压后就可以直接用，不用编译，这是直接编译好的，如果下载tar.gz格式，需要按照readme文档步骤自己编译。按照文档说明，先要编译spinxbase，然后编译sphinxtrain，编译完之后把spinxbase中bin\release\下的dll文件和exe文件拷贝到sphinxtrain中bin\release\目录下，这样安装就完成了