Unbuntu16.04+Kaldi本地运行timit语料(完整版)

来源:互联网 发布:一键php加mysql环境 编辑:程序博客网 时间:2024/06/06 12:40

TIMIT数据集的语音采样频率为16kHz,一共包含6300个句子,由来自美国八个主要方言地区的630个人每人说出给定的10个句子,所有的句子都在音素级别(phone level)上进行了手动分割,标记。70%的说话人是男性;大多数说话者是成年白人。

首先准备数据集

将数据集放再kaldi/egs/timit/data/中解压

rar x timit.rar

注:若没有安装rar,可根据相应的提示安装


然后修改s5文件里的脚本文件

(1)修改run.sh

第30行

feats_nj=10train_nj=20decode_nj=5

第39行 timit=/home/Michael/kaldi/egs/timit/data/timit  此处为设置数据路径

(2)修改cmd.sh

export train_cmd=run.plexport decode_cmd=run.plexport mkgraph_cmd=run.plexport cuda_cmd=run.pl
其他的均注释掉


接着安装irstlim

进入kaldi/tools/extras/下,执行命令

./install_irstlm.sh 
安装完毕之后,执行命令

cp irstlm ../


最后,进入s5文件运行run.sh

./run.sh


实验运行ing。。。

后续再写结果分析吧