kaldi中深度学习的主要实现-

来源：互联网发布：炫踪网络金利科技编辑：程序博客网时间：2024/06/05 04:35

http://blog.csdn.net/wbgxx333/article/details/24438405

因为我们翻译的文档都有url，csdn不支持我们的直接发表，所以只能用图片，最后的翻译会集成pdf版，后面会公开的。


kaldi的学习过程。
             第一步，都是安装过程。大家根据我之前的安装博客，一般都可以安装成功，当然可能大家的平台不同，导致了一些问题，但这些都是可以解决的。平台大多数是：ubuntu，cygwin等。
             第二步，一般测试下自己是否成功。可以用yesno的数据库测试下。在egs目录下的yesno目录下。
             第三步，你可以用我之前分享的timit数据库，当然由于版权问题，你只能自己去做实验，不能发表文章或者其他用途。timit数据集还是比较小的，大约635MB。你可以先跑run.sh，然后再单独每个步骤的去运行，这样你就知道自己每步做了些什么，你就更加的理解。
            第四步，你可以用你自己的数据库训练模型和识别。这里的第一步就是数据准备阶段，这个还是有点麻烦，大家可以去kaldi主页上看这部分的内容，等群里@V翻译出来，大家就可以看中文的了。自己训练的自己数据库有些东西还是比较麻烦了，只有自己实践了才会清楚。
            此外，kaldi的主页还有一些其他的功能;比如关键词识别和在线识别等等。大家也可以去尝试。
  最后，备注下。现在kaldi中有两个公开的语音库，你可以去用下，分别是：vystadial_cz和vystadial_en。这个都可以在povey主页中下到，当然你下载了kaldi，进这些目录页可以用程序下载了。这个是数据的问题。此外，还有大家在群里问的问题，如果kaldi的问题没有人回答，可以去http://sourceforge.net/p/kaldi/discussion/这里问，povey及他的同事们会热情的回答大家问题。

阅读全文

0 0