VTLN(Vocal Tract Length Normalisation)

来源:互联网 发布:量化宽松 知乎 编辑:程序博客网 时间:2024/06/16 13:21

VTLN是Vocal Tract Length Normalisation 的简称。中文为:声道长度归一化。主要用于语音识别,消除男,女的声道长度的差异。在HTK中有源码,HTK book中有介绍。修改了MEL频率中的中心频率。

用到的参数:

WARPFREQ
LOFREQ
HIFREQ
variables (WARPLCUTOFF) and (WARPUCUTOFF).
变量IOConfigRec 
变量赋值defConf
在函数InitFBank中
赋值
 alpha = 0.8;
 warpLowCut = 60;
warpUpCut  = 4000;