声学特征变换 fMLLR
来源:互联网 发布:知乎 如何挑选浴缸 编辑:程序博客网 时间:2024/06/08 07:15
含义
当测试数据
- model-space 也就是
- feature-space 也就是
其中model-space的变换又可以分为两种:
- unconstrained: 均值和方差无关
- constrained: 均值和方差变换是相同的形式
对于constrained model-space transformations,虽然出发点是对模型的均值和方差做转换,但是公式推导[2]最后的形式可以看成对输入的特征做线性变化,所以Constrained Maximum Likelihood Linear Regression (CMLLR)也称为feature-space MLLR (fMLLR)。
fMLLR主要用于SAT(speaker adaptive training)训练,基本思想是训练得到的转化矩阵,使得adaptation数据在当前模型获得最大似然值。
kaldi使用
steps/train_sat.sh
#1.获得trans# 假设特征40维,每个speaker对应一个40*41维的矩阵gmm-est-fmllr#使用transtransform-feats --utt2spk=ark:$sdata/JOB/utt2spk ark,s,cs:$dir/trans.JOB ark:- ark:- |#查看trans矩阵copy-matrix ark:trans.1 ark,t:trans.1.txt
参考
[1].A Maximum-Likelihood Approach to Stochastic Matching for Robust Speech Recognition
[2].Maximum likelihood linear transformations for HMM-based speech recognition
阅读全文
0 0
- 声学特征变换 fMLLR
- 声学特征变换 LDA
- 声学特征变换 STC/MLLT
- 声学特征 PLP
- 声学特征 PNCC
- 声学特征 ivector
- 声学特征(三) pitch
- 声学特征转换 kaldi工具
- 声学特征(二) MFCC特征原理
- 声学特征(一) HTK抽取MFCC特征
- 声学
- 声学特征(四) pitch-yin代码实现
- 特征理解-基于变换
- 特征变换(3)小波变换
- 特征变换(5)K-L变换
- 尺度不变特征变换SIFT
- 特征变换(1)傅里叶变换
- 特征变换(7)总结
- python笔记---需求文件requirements.txt的创建及使用
- 线程监控
- 集体智慧编程中文版错误记录
- iOS Reactivecocoa(RAC)原理分析
- CSS-Flexbox
- 声学特征变换 fMLLR
- Struts防止表单重复提交
- Mysql+Keepalived高可用性双主配置
- 解决java.lang.IncompatibleClassChangeError
- Spring boot学习(1)
- Ubuntu和Windows共享文件
- Debian 9安装docker ce
- 声学特征变换 STC/MLLT
- Python数组与元组个人笔记