语音训练系统ant4 sphinxtrain
来源:互联网 发布:读图知天下 编辑:程序博客网 时间:2024/06/06 20:56
http://www.blogbus.com/yesho-logs/10287047.html
可以从Sphinx网站上免费下载SphinxTrain和AN4语料库,解压之后编译SphinxTrain,参考SphinxTrain\doc\tinydoc.txt搭建训练系统(windows下)。
1. 建立训练系统工作目录an4,在此目录下运行
perl $SPHINXTRAINDIR\scripts_pl\setup_SphinxTrain.pl -task an4
2. 将AN4语料库中用于训练的语音文件,即wav\an4_clstk\里的数据copy到工作目录an4\wav\下。
3. 将AN4语料库中的其他文件,即etc\目录下的文件copy到an4\etc\下,包括an4.dic、an4.filler、an4.phone、an4_train.fileids、an4_train.transcription,修改an4_train.fileids的内容,去掉所有行中的an4_clstk/。
4. 运行
perl scripts_pl\make_feats.pl -ctl etc\an4_train.fileids
提取特征。
5. scripts_pl目录下有很多文件夹,对应各个不同的训练任务。参考RunAll.pl可以了解应该运行各目录下哪个perl文件。这里我们选用20.ci_hmm\slave_convg.pl,建立一个CI(Context Independent)的连续HMM系统,完成之后在model_parameters\an4.ci_cont\下得到模型参数。
6. 此时得到的模型每个状态的Gauss mixture数为1,如果想要mixture数大于1,修改sphinx_train.cfg中的$CFG_CI_MGAU='yes',mixture数可以修改$CFG_FINAL_NUM_DENSITIES,默认为8;
7. split_gaussian.pl中存在bug,137行调用inc_comp.exe时给了参数-feat和-ceplen,去掉。
8. 重新运行20.ci_hmm\slave_convg.pl,最终得到的模型参数在\model_parameters\an4.ci_cont_n\下,n为mixture数。
- 语音训练系统ant4 sphinxtrain
- PocketSphinx语音识别系统声学模型的训练与使用
- PocketSphinx语音识别系统声学模型的训练与使用
- PocketSphinx语音识别系统----声学模型的训练与使用
- 2-GMM-HMMs语音识别系统-训练篇
- 2-GMM-HMMs语音识别系统-训练篇
- 语音训练营
- 语音系统
- PocketSphinx语音识别系统语言模型的训练和声学模型的改进
- PocketSphinx语音识别系统语言模型的训练和声学模型的改进
- PocketSphinx语音识别系统语言模型的训练和声学模型的改进
- 翻译的SphinxTrain说明文件
- 语音系统效率辨析
- 中英文语音系统
- 电话语音查询系统
- 构建语音识别系统
- 多方语音对讲系统
- 文本转换语音系统
- SharePoint常用目录介绍
- 软件开发-理论性知识(一)
- ARM的快速上下文切换(FCSE)
- at com.mysql.jdbc.PreparedStatement.asSql
- ARM存储管理系统MMU
- 语音训练系统ant4 sphinxtrain
- STM32的中断处理2
- 那些年写过的shell---the function of debug
- Vijos P1034家族 并查集基础
- 中国强大的双卡双待手机读取IMEI号
- 在HorizontalScrollView里添加自定义View的效率问题
- Ubuntu 12.10 下安装拼音输入法
- Ext 始终window居中显示
- 开启归档模式及其相关参数