Sphinx学习(XP上的环境搭建)

来源:互联网 发布:数据库工程师 考试 编辑:程序博客网 时间:2024/05/17 23:35

刚开始参照如下博客进行学习,并针对自己在windows XP平台上的问题

http://www.cnblogs.com/huanghuang/archive/2011/07/14/2106579.html

一、使用平台

        windows XP + VS2010

二、     CMUSphinx语音识别工具包

Pocketsphinx — 用C语言编写的轻量级识别库

Sphinxbase — Pocketsphinx所需要的支持库

Sphinx3 — 为语音识别研究用C语言编写的解码器

CMUclmtk — 语言模型工具

Sphinxtrain — 声学模型训练工具

 

三、环境搭建

 http://cmusphinx.sourceforge.net/wiki/download/

下载最新版,我使用的是

sphinxbase-0.7.tar.gz

pocketsphinx-0.7.tar.gz

sphinxtrain-1.0.7.tar.gz

cmuclmtk-0.7.tar.gz

然后直接编译,先编译sphinxbase,将其解压后,它的文件名为sphinxbase,再编译,然后依次编译

但是我在编译sphinxtrain时老是有错误,无法解决,然后又用了另一种方法。

同样在下载页面下载,不过下载的是snapshot版本,

pocketsphinx-snapshot,sphinxbase-snapshot,sphinxtrain-snapshot,

将这3个都解压到 F:\speech_recognition中,分别编译,在debug中生成.dll和.exe文件

同时将前面下载的最新版的前3个文件分别解压到F:\acoustic中

将F:\speech_recognition\sphinxbase\debug中的.exe与.dll文件拷贝到F:\acoustic\sphinxbase\bin中;

 F:\speech_recognition\pocketsphinx\bin\Debug 中的 .exe与.dll文件拷贝到    F:\acoustic\pocketsphinx\bin中;

F:\speech_recognition\SphinxTrain\bin\Debug中的.exe拷贝到F:\acoustic\sphinxtrain\bin\Release中(Release是自己建立的)。

cmuclmtk-0.7.tar.gz直接编译即可。

这样环境就基本建立了。

 

 利用现有的语言模型和声学模型,和刚开始链接中的博客是一样的。但是我识别出来的都是乱码,不知道是怎么回事。

原创粉丝点击