语音识别工具箱之kaldi----研究联盟

来源:互联网 发布:英语解题的软件 编辑:程序博客网 时间:2024/03/28 19:56

转自:http://blog.csdn.net/wbgxx333/article/details/17893641

今晚突然有个想法,由于kaldi 的中文资料比较少,而且由于这个工具箱比较新,所以我想借用大家的力量来为以后的人研究铺好一些路。所以现在我打算,也是希望大家可以从kaldi的原理上去理解kaldi的实现过程,也是大家不断学习的过程。就像网上很多htk的资料一样,大家也可以来丰富kaldi的内容。大家实现资料共享,共同学习的目的。希望我们都可以学到更多的知识。这是是唯一的目的。

   相信大家研究kaldi都有自己的目的,一个人去做事情的时候或者缺少点什么,大家一起去做去问可能会有很好的效果。现列下现阶段的一些想法:

         1.提供kaldi的安装包和安装说明,这个kaldi的安装说明基本我都写了,剩下的就是答疑。就是帮助大家解决kaldi安装中出现的一些问题。安装好kaldi是学习的基本,所以希望可以帮助大家更好的安装和更快的安装。如果大家有任何问题均可留言和联系我。

         2.深入理解kaldi的一些原理,比如:对数据的处理,提取特征,声学模型,语言模型,解码等一系列部分。由于一个人的力量是有限的,要完成这么多的东西还是比较难的。希望大家可以选择其一,深入研究,然后写博客和自己的理解。这个是我比较希望完成的。

         3.对kaldi的改进。这个我还不敢说很多,因为我也是个初学者,自己也不是大牛什么的。所以希望牛人指导,呵呵……

         4.深度学习这一部分,由于最近深度学习对语音识别的提高是突飞猛进的。我希望我们可以帮现阶段最好的方法运用上去,达到最好的效果。

  最后,提下困难吧。困难是很多的:

      第一,寻找合适的人做合适的事情。我们的研究只是为了自己,也很松散,大家都是自觉的去学习,所以麻烦还是会有的。但是,我想,我们还是一点一点的去积累。

      第二,我们写说明的困难。想真正的理解kaldi不是件容易的事情,可能需要很长时间的琢磨和推敲,但是,没关系,我们就是去学习。

      第三,语音数据的问题和实验的问题。这个也不是我可以解决的,但至少timit数据库我们有了,其他的我们可以寻找和等待有开放的资源。

 希望,这不是个冲动,也希望我们可以真正的做出点东西来。我希望是不断的有人在弄,有人共享。

 

  如果有人愿意,大家可以留言,然后我建个qq群保持联系。也可以随时和我联系,说说你的想法。

 

0 0