如何利用kaldi提自己想要的特征（mfcc plp pitch）

来源：互联网发布：java 解析器模式编辑：程序博客网时间：2024/05/22 03:33

群里的@卡丁王一直想用kaldi提自己想要的特征，但是他老是出现错误。我自己试验下，下面是具体流程，希望你有所收获。

首先，确保你的s5文件夹有conf local step utils文件夹。然后你把你的数据保存为test文件夹，比如test文件夹里有test1.wav test2.wav test3.wav。

然后，新建个data文件夹，data文件夹新建个test文件夹，这个test文件夹里需要三个文件：wav.scp utt2spk spk2utt。

Wav.scp可以这么写：

test1 test/test1.wav

test2 test/test2.wav

test3 test/test3.wav

Utt2spk可以这么写：

test1 global

test2 global

test3 global

Spk2utt可以这么写：

global test1 test2 test3

至此，都准备好了。

然后改下脚本。Run1.sh的内容为：

#!/bin/bash

train_cmd="utils/run.pl"

decode_cmd="utils/run.pl"

# Feature extraction

for x in test ; do

steps/make_mfcc.sh --nj 1 data/$x exp/make_mfcc/$x mfcc

done

最后运行脚本run1.sh即可。

最后你就得到你想要的特征了。怎么样，简单吧。let us continue……

此外，kaldi里的mfcc如何与htk里的mfcc转换？

在kaldi中，kaldi支持了copy-feats-to-htk来把kaldi里的mfcc转换为htk的mfcc。

至于，htk怎么转换为kaldi的？等待其他人公开吧。

0 0