声学模型训练-LDA算法
来源:互联网 发布:克拉丽丝claris知乎 编辑:程序博客网 时间:2024/04/29 19:36
语音识别中,为了增强音频特征的鲁棒性,需要提取区分能力较强的特征向量,常用的方法是PCA和LDA算法。
PCA算法寻找,保留数据中最有效的,最重要的成分,舍去一些冗余的,包含信息量减少的成分。
LDA算法是通过一个变化矩阵来达到降维的目的,LDA与PCA不同之处在于,LDA使得样本内的分布凝聚,使得样本间的分布疏远,这样的特征更加有代表性,在分类里面LDA算法更优。
如下图所示:
LDA有如下假设:
1)特征向量投影后不是所有的维都包含具有区分力的信息,他们都被包含在前P维子空间,而后(n-p)维子空间不包含有用的信息而被忽略;
2)每个样本内都是高斯分布。
公式定义如下:
当语音特征用向量表示时,LDA算法希望模式样本间的协方差矩阵Sb越大越好,
而样本内的协方差矩阵Sw越小越好,因此上式中使得Wopt取最大值。
投影矩阵的列向量为:d个最大特征值(矩阵的特征向量)所对应的特征向量
经过LDA变换后的协方差矩阵不能对角化,因此需要经过MLLT(MaximumLikelihood Linear Transformation, MLLT )进行变换。
MLLT算法的介绍会在下一篇文章详细介绍。
0 0
- 声学模型训练-LDA算法
- Kaldi声学模型训练
- 声学模型训练-嵌入式训练
- 声学模型训练----Acoustic Modeling
- 声学模型GMM-HMM训练
- LDA主题模型的训练算法和预测算法
- 声学模型(一) hmm声学训练流程
- Pocketsphinx语音识别--重新训练声学模型
- 七、训练自己的声学模型
- Kaldi 训练一个 DNN 声学模型
- 训练自已的中文语言模型与声学模型
- 使用训练好的语言模型与声学模型
- 声学特征变换 LDA
- CMU sphinx训练命令控制声学模型问题
- PocketSphinx语音识别系统声学模型的训练与使用
- 语音识别工具包pocketsphinx-0.8声学模型训练
- PocketSphinx语音识别系统声学模型的训练与使用
- PocketSphinx语音识别系统----声学模型的训练与使用
- C语言-阶乘数列
- 数组进行奇数和偶数操作 把奇数放在数组前面 偶数放在数组后面
- jsp 九大对象 七大动作 三大指令
- java知识列表
- 浅谈Http
- 声学模型训练-LDA算法
- 两个排好序的数组找第k大
- LeetCode097 Interleaving String
- 广搜模版BFS
- 集合框架-Set集合
- 认知革命
- iOS autolayout 删除 cell 的 topmargin
- Ceilometr: 10、 Ceilometer-Alarm常用命令行
- Boost库学习笔记