语音识别系统之htk-----连续语音识别

来源:互联网 发布:怎样做淘宝直播 编辑:程序博客网 时间:2024/04/30 01:00

    在零落_World的合作下,终于完成了htk实现连续语音识别的一个流程。中间遇到了很多不大不小的问题。具体的可以见:

            1.HTK搭建大词汇量连续语音识别系统(一)

            2.HTK搭建大词汇量连续语音识别系统(二)

            3.HTK搭建大词汇量连续语音识别系统(三)

    这三篇博文基本涵盖了使用htk在timit上的使用。具体我们参考了应用HTK搭建语音拨号系统。这个是系列文章,具体的pdf和实验材料可以在http://su.tonghua.googlepages.com/voicedialsystem.zip或者http://tutorial.googlecode.com/files/VoiceDialSystem.zip等去下载。这个在网上找也很好找。因为是别人的东西,所以我上传也不太好。

一 数据准备

     语音数据是非常珍贵的,LDC上的数据基本都是收费的,国内很多科研高校和机构都买过。期待他们可以把数据开放出来,呵呵……其他的英文数据还有的是在voxforge上收集。这个免费下载的,就是时间比较长了。中文的数据可以在数据堂里有偿下载,或者找些免费的下载吧。下面的timit是LDC里的,也是收费的,但是总是有好人把他公布出来。大家就内部下载,内部使用吧。我们都没有版权的哦。

    timit数据库的下载我在博文TIMIT语音库-----下载和matlab读取  提到的 http://www.fon.hum.uva.nl/david/ma_ssp/2007/TIMIT/,你可以用软件下到完整版。我不想上传我的数据,因为我不知道是不是很完整,我需要跟大家来核对下。最近比较忙,加上timit太多的东西,我根本没时间去核对。如果大家下载下来了,想核对的,可以找我。我们相互交换下。一旦我确定我的是完整的,我就会上传给大家。

二 实验

  具体的实验在上面我列了三个博文。大家可以参考。应该是国内首发,基本把详细的步骤列出来。感谢@落_world的努力,我自己也没帮上很多忙。基本都是他自己在折腾,然后写出来跟大家分享。希望大家可以在这个博文的帮助下,能够把连续语音识别做的更好吧。期待很多的中文资料出现。我们在实验过程中遇到很多错误,大家遇到不要紧张,根据htk提供的错误检查出来就可以了。一般的错误都列出来了,我们认真检查就可以了。我们现在的版本还有很多不足,得到的结果还不好。需要后面不断的实验,不断的调整。如果你有什么好的建议和想法,欢迎交流。我qq:354475072。祝你实验顺利……

三 附上一些资料

   我自己从进入研究生学习,在学长的帮助下就开始学习语音识别。虽然自己开的题不是语音识别,但是我自己对这个方面一定会投入时间和精力的。因为,我喜欢这个,就是这么简单。下面是资料清单,希望对你有帮助吧。

    1.HTK-TIMIT Phone Recognition 这个是matlab的文件,里面还有个htk_utt.m。大家的命令和去参考,也可以在matlab中直接使用这个。

    2.http://hi.baidu.com/hardyheron/archive/tag/lvcsr 这个网址里有些关于htk的资料。感觉以后会有用,大家可以看看。

    3.http://www.keithv.com/software/htk/us/  提供一些声学模型的资料。

    4.Dan Ellis 牛人的主页。里面有太多的东西。当然也有htk的资料。

 

 

还有很多的资料,我就不多说了。但愿对你有用。此外,欢迎交流。

   

1 0