kaldi中深度学习的主要实现-

来源:互联网 发布:炫踪网络 金利科技 编辑:程序博客网 时间:2024/06/05 04:35





http://blog.csdn.net/wbgxx333/article/details/24438405



因为我们翻译的文档都有url,csdn不支持我们的直接发表,所以只能用图片,最后的翻译会集成pdf版,后面会公开的。



kaldi的学习过程。

             第一步,都是安装过程。大家根据我之前的安装博客,一般都可以安装成功,当然可能大家的平台不同,导致了一些问题,但这些都是可以解决的。平台大多数是:ubuntu,cygwin等。

             第二步,一般测试下自己是否成功。可以用yesno的数据库测试下。在egs目录下的yesno目录下。

             第三步,你可以用我之前分享的timit数据库,当然由于版权问题,你只能自己去做实验,不能发表文章或者其他用途。timit数据集还是比较小的,大约635MB。你可以先跑run.sh,然后再单独每个步骤的去运行,这样你就知道自己每步做了些什么,你就更加的理解。

            第四步,你可以用你自己的数据库训练模型和识别。这里的第一步就是数据准备阶段,这个还是有点麻烦,大家可以去kaldi主页上看这部分的内容,等群里@V翻译出来,大家就可以看中文的了。自己训练的自己数据库有些东西还是比较麻烦了,只有自己实践了才会清楚。

            此外,kaldi的主页还有一些其他的功能;比如关键词识别和在线识别等等。大家也可以去尝试。

  最后,备注下。现在kaldi中有两个公开的语音库,你可以去用下,分别是:vystadial_cz和vystadial_en。这个都可以在povey主页中下到,当然你下载了kaldi,进这些目录页可以用程序下载了。这个是数据的问题。此外,还有大家在群里问的问题,如果kaldi的问题没有人回答,可以去http://sourceforge.net/p/kaldi/discussion/这里问,povey及他的同事们会热情的回答大家问题。