语音训练系统ant4 sphinxtrain

来源:互联网 发布:读图知天下 编辑:程序博客网 时间:2024/06/06 20:56

http://www.blogbus.com/yesho-logs/10287047.html

可以从Sphinx网站上免费下载SphinxTrain和AN4语料库,解压之后编译SphinxTrain,参考SphinxTrain\doc\tinydoc.txt搭建训练系统(windows下)。

1.  建立训练系统工作目录an4,在此目录下运行
 perl $SPHINXTRAINDIR\scripts_pl\setup_SphinxTrain.pl -task an4

2.  将AN4语料库中用于训练的语音文件,即wav\an4_clstk\里的数据copy到工作目录an4\wav\下。

3.  将AN4语料库中的其他文件,即etc\目录下的文件copy到an4\etc\下,包括an4.dic、an4.filler、an4.phone、an4_train.fileids、an4_train.transcription,修改an4_train.fileids的内容,去掉所有行中的an4_clstk/。

4.  运行
 perl scripts_pl\make_feats.pl -ctl etc\an4_train.fileids
提取特征。

5.  scripts_pl目录下有很多文件夹,对应各个不同的训练任务。参考RunAll.pl可以了解应该运行各目录下哪个perl文件。这里我们选用20.ci_hmm\slave_convg.pl,建立一个CI(Context Independent)的连续HMM系统,完成之后在model_parameters\an4.ci_cont\下得到模型参数。

6.  此时得到的模型每个状态的Gauss mixture数为1,如果想要mixture数大于1,修改sphinx_train.cfg中的$CFG_CI_MGAU='yes',mixture数可以修改$CFG_FINAL_NUM_DENSITIES,默认为8;

7.  split_gaussian.pl中存在bug,137行调用inc_comp.exe时给了参数-feat和-ceplen,去掉。

8.  重新运行20.ci_hmm\slave_convg.pl,最终得到的模型参数在\model_parameters\an4.ci_cont_n\下,n为mixture数。


原创粉丝点击