【kaldi】Kaldi tutorial翻译之Prerequisites(前提条件)-kaldi学习前必备梳理

来源:互联网 发布:avmoo欧美域名 编辑:程序博客网 时间:2024/05/17 01:05


本翻译仅供自己学习使用,不承担任何其他责任。水平有限拒绝转载。欢迎大家指出错误,共同学习。



我们假设本页的读者了解使用HMM-GMM进行语音识别的基础知识。在这里我们需要在线简明介绍的是:M. Gales and S. Young (2007).``The Application of Hidden Markov Models in Speech Recognition." Foundations and Trends in Signal Processing 1(3): 195-304. HTK教程也是一个非常好的资源。然而,除非你拥有很棒的数学底子而且非常专注于它,我们并不建议学习者冲破经典(outside an institutional setting.)进行语音识别学习。本页读者同时也是语音识别研究者,也可能是这个领域的毕业生或者进阶者。



我们假定你知道C++,至少熟悉一些shell脚本,最好使用bash或者相近的shell。本教程假定你正在使用UNIX相关环境或者Cygwin(虽然Kaldi不必完全匹配或者运行在所有的这些环境中)。


还有重要的是,本教程假定你能访问在Linguistic Data Consortium (LDC)中的Resource Management (RM) CDs中的原始分布式数据(in the original form as distributed)。我们假定你已经下载了这些数据并且同时获得了目录编号为LDC93S3A的数据。它被分为两个部分。请仔细一点,因为RM数据用不同的布局时预先会有一个不同的分布。


本系统的必要条件很简单。我们假定你拥有以下工具包(tools)包括wget, git, svn, awk, perl等等,或者你了解如何去安装它们。安装过程中最困难的部分主要跟math library ATLAS相关。如果你系统当中没有安装这个库,你需要去编辑它而且这过程中CPU throttling需要被关闭,这需要root权限。我们提供所有安装步骤的脚本和细节介绍。当脚本运行失败,请仔细阅读运行结果,可以为如何解决这个问题提供思路。如果在任何步骤有问题请联系我们,无论这个问题多么小,请参照 Other Kaldi-related resources (and how to get help)。


我们提供了一些关于本教程中每一步执行需要多久之类的信息。如果你只有很有限的时间去完成这个教程,一定要跳过以下步骤及不想链接到我们在文本中提供的那么多信息的话,我们还是建议你尽量遵守已经公布的时间表。这将会确保你能得到一个比较好的全局概览。你在之后的学习中需要复习更多数学中的细节。如果本教程用于教学,请把整个教程在相应环境下运行一遍,以此确保所有的先行条件都被安装。

---------------------------------------------------------------------------------------------------------

kaldi主页:http://kaldi-asr.org/doc/index.html

---------------------------------------------------------------------------------------------------------


0 0