matlab DTW语音识别算法调试

来源:互联网 发布:彩虹六号围攻 mac 编辑:程序博客网 时间:2024/04/20 10:36

下载地址:http://download.csdn.net/detail/fzxy002763/4082023

算法不是原创的,由于网上流传版本很多,不过都是独立给出一些m文件,不完整,故笔者整理了一下,调试通过,方便大家学习下dtw算法。

其中dtw_test是测试文件,其他皆为function文件

disp('正在计算参考模板的参数...')for i=1:5fname = sprintf('%da.wav',i);x=fname;    [x,fs]=wavread(x);[x1 x2] = vad(x);m = mfcc(x);m = m(x1-2:x2-2,:);ref(i).mfcc = m;   % soundview(x);enddisp('正在计算测试模板的参数...')for i=1:1    %[x,fs]=wavread('E:\\3.wav')fname = sprintf('%db.wav',i);x=fname;    [x,fs]=wavread(x);    [x1 x2] = vad(x);m = mfcc(x);m = m(x1-2:x2-2,:);test(i).mfcc = m;enddisp('正在进行模板匹配...')dist = zeros(1,5);for i=1:1for j=1:5dist(i,j) = dtw(test(i).mfcc, ref(j).mfcc);endenddisp('正在计算匹配结果...')for i=1:1[d,j] = min(dist(i,:));fprintf('测试模板 %d 的识别结果为:%d\n', i, j);end
略微改动了下原版,这里两次循环,第一次1~5,主要检索模板,计算梅尔倒普系数等一些声纹特征,然后在第二次循环中进行模板匹配的计算。这里文件命名原则是%da,如1a,1b,测试结果显示为“测试模板%d的识别结果为x”,即意义是哪一个wav文件匹配哪一个文件,如程序测试结果为:

1.vad


2.识别


故是4a.wav匹配1b.wav,可以自行设定理解,PS:录音最好时间差不多,且大于1S,要不然可能会报index exceeds matrix dimensions这种错误。

原创粉丝点击