如何利用kaldi提自己想要的特征(mfcc plp pitch)

来源:互联网 发布:java 解析器模式 编辑:程序博客网 时间:2024/05/22 03:33

群里的@卡丁王一直想用kaldi提自己想要的特征,但是他老是出现错误。我自己试验下,下面是具体流程,希望你有所收获。

首先,确保你的s5文件夹有conf local step utils文件夹。然后你把你的数据保存为test文件夹,比如test文件夹里有test1.wav test2.wav test3.wav

然后,新建个data文件夹,data文件夹新建个test文件夹,这个test文件夹里需要三个文件:wav.scp utt2spk  spk2utt

Wav.scp可以这么写:

test1 test/test1.wav

test2 test/test2.wav

test3 test/test3.wav

Utt2spk可以这么写:

test1 global

test2 global

test3 global

Spk2utt可以这么写:

global test1 test2 test3

至此,都准备好了。

然后改下脚本。Run1.sh的内容为:

#!/bin/bash

train_cmd="utils/run.pl"

decode_cmd="utils/run.pl"

 

# Feature extraction

for x in test ; do 

 steps/make_mfcc.sh --nj 1 data/$x exp/make_mfcc/$x mfcc

done


最后运行脚本run1.sh即可。


最后你就得到你想要的特征了。怎么样,简单吧。let us continue……

 

 此外,kaldi里的mfcc如何与htk里的mfcc转换?

在kaldi中,kaldi支持了copy-feats-to-htk来把kaldi里的mfcc转换为htk的mfcc。

至于,htk怎么转换为kaldi的?等待其他人公开吧。

0 0
原创粉丝点击