声学特征变换 STC/MLLT
来源:互联网 发布:知乎 如何挑选浴缸 编辑:程序博客网 时间:2024/06/06 19:47
背景
Global Semi-tied Covariance (STC)/Maximum Likelihood Linear Transform (MLLT) estimation
gmm建模方差使用对角矩阵的前提是假设特征之间相互独立,使用full或者block-diagonal矩阵可以对相关性的特征建模,但是参数增多。为了解决使用这个问题,有两种方法:
- feature-space 使用DCT或者LDA去相关
- model-space 不同的模型可以使用不同的转换,更灵活
semi-tied covariance matrices是model-space里面的一种形式,也是为了解决使用full covariance的参数量大的问题。相比于full covariance,这种方法的每个高斯分量有两个方差矩阵:
1. diagonal covariance
2. semi-tied class-dependent nondiagonal matrix
最后的方差矩阵:
如果做变换
kaldi实现
steps/train_lda_mllt.sh
假设特征40维,得到的mllt转换矩阵是40*40,转换矩阵同时作用于gmm的均值和特征
参考
1.Semi-tied covariance matrices for hidden Markov models
- 声学特征变换 STC/MLLT
- 声学特征变换 fMLLR
- 声学特征变换 LDA
- 声学特征 PLP
- 声学特征 PNCC
- 声学特征 ivector
- 声学特征(三) pitch
- 声学特征转换 kaldi工具
- 声学特征(二) MFCC特征原理
- 声学特征(一) HTK抽取MFCC特征
- 声学
- STC
- stc
- 声学特征(四) pitch-yin代码实现
- 特征理解-基于变换
- 特征变换(3)小波变换
- 特征变换(5)K-L变换
- 尺度不变特征变换SIFT
- Mysql+Keepalived高可用性双主配置
- 解决java.lang.IncompatibleClassChangeError
- Spring boot学习(1)
- Ubuntu和Windows共享文件
- Debian 9安装docker ce
- 声学特征变换 STC/MLLT
- Python数组与元组个人笔记
- 防止Android点击按钮过快造成多次事件实现原理
- 二、java项目常用工具类之beancopy,bean和map转换工具类
- 解决回调函数里面回调另一个函数,另一个函数的参数需要依赖这个回调函数(promise)
- SSM+shiro
- 单点登录SSO-使用session共享方式
- [编程题] 最大和
- 声学特征变换 LDA