声学模型构图过程-HCLG

来源:互联网 发布:k-means java 编辑:程序博客网 时间:2024/06/06 03:16

语音识别过程中需要对声学模型进行构图,即扩展HCLG的过程,

扩展是按照H<-C<-L<-G的顺序进行的,

首先扩展G,

1.G.fst: The Language Model FST

FSA grammar,可以通过n-gram构建得到,即把字构成了词组


2.L_disambig.fst: The Phonetic Dictionary with Disambiguation Symbols FST

构建一个FST(LG),输入时phone,输出是word,即把phone转化成了字


3.C.fst: The Context FST

把triphone 转化成monophone,即在第2步骤中扩展了context,即扩展triphone,最终输出是CLG



4.H.fst: The HMM FST

把HMM的state映射到triphone ,即把HMM的pdf-id映射到triphone,也就是扩展了HMM,
即输入时pdf-id,输出是word,也就是HCLG


HCLG.fst: final graph

把步骤1-4合起来HCLG,就是构图中构建WFST的过程。

即,输入是pdf-id,输出是对应的词组




1 0