sphinx4当中的语言模型工具和声学模型工具

来源:互联网 发布:沪港通持股数据 编辑:程序博客网 时间:2024/05/21 22:50

在此网站可以看到http://www.speech.cs.cmu.edu/#resources

    这两个工具的定位是不同的,SLM是用来训练大数据的,正如官方所说的,如果只是训练几百个句子,杀鸡就不用牛刀了,我们可以选择 Sphinx Knowledge Base Tool,这个工具简单,易用,你所要做的只是给他提供语料,剩下的它会帮你在线完成,这个工具同样也有两个版本,一个简易版,就是刚进去所呈现的版本,一个是高级版本Advanced Version,点击它,就会进入高级版本,高级版本比简易版多了一些设置,比如音素集选择,模型选择的,用于我只用于研究,所以会用到这个小语言工具,没有看SLM工具。记住语言模型是用来限制词的搜索范围的(语言或者语法模型当中没有的词不会出现在输出当中)。个人感觉是由模型解码出音素序列,然后在字典中查找对应的单词,最后根据语言模型从候选单词中选出需要输出的单词。(我用自己制作的词典,与用cmu的官方词典识别的结果是一样的,只是我的语言模型用的我自己的)

    sphinx4的声学模型训练工具需要用到sphinxtrain以及sphinxbase,这两个资源可以在此处下载到http://sourceforge.net/projects/cmusphinx/files/,有tar.gz和*.win32.zip格式,如果下载win32.zip格式,解压后就可以直接用,不用编译,这是直接编译好的,如果下载tar.gz格式,需要按照readme文档步骤自己编译。按照文档说明,先要编译spinxbase,然后编译sphinxtrain,编译完之后把spinxbase中bin\release\下的dll文件和exe文件拷贝到sphinxtrain中bin\release\目录下,这样安装就完成了

原创粉丝点击