HMM经典介绍论文【Rabiner 1989】翻译(十)——连续观测密度

来源:互联网 发布:淘宝工商银行不能付款 编辑:程序博客网 时间:2024/05/17 01:06

4.1 连续观测密度

目前为止我们的讨论中只考虑了观测是离散值的情况,这种情况下对每个状态可以使用离散概率密度。但是存在一些应用离散值是连续信号(比如向量)。虽然可以通过码本把连续信号量化,但是这种量化可能存在严重的退化。所以希望HMM中可以用连续观测密度。

为了使用连续观测密度,必须对模型概率密度函数(probability density function, pdf)进行约束以使得pdf的参数可以通过一致的方法进行估计。最一般的pdf的表示是如下的有限混合形式:

bi(O)=m=1Mcjmf[O,μjm,Ujm],1jN(49)

其中O是被建模的向量,cjm是在状态j的第m个混合的系数,f是log-凹或者椭圆对称密度(比如高斯),μjmUjm分别为状态j下第m个混合的均值向量和协方差矩阵。一般f为高斯密度。混合增益cjm满足随机约束:

m=1Mcjm=1,1jN(50a)

cjm0,1jN,1mM(50b)

以使得pdf被正确归一化,即

bj(x)dx=1,1jN.(51)

(49)表示的pdf可以任意近地近似任一有限连续密度函数。所以可以用于解决很多问题。

混合密度系数的估计公式为

cjk¯=Tt=1γt(j,k)Tt=1Mk=1γt(j,k)(52)

μ¯jk=Tt=1γt(j,k)OtTt=1γt(j,k)(53)

U¯jk=Tt=1γt(j,k)(Otμjk)(Otμjk)Tt=1γ(tj,k)(54)

其中表示向量转置,γt(j,k)是用第k个混合元素解释Ot 时,t时刻状态为j的概率,即

γt(j,k)=αt(j)βt(j)Nj=1αt(j)βt(j)cjkf(Ot,μjk,Ujk)Mm=1cjmf(Ot,μjm,Ujm).

γt(j,k)在只有一个混合的时候泛化为(26)中的γt(j)aij的估计表达式和离散观测密度时的一样((40b))。cjk的估计式是当使用第k个混合元素时系统在状态j的期望次数与系统在状态j的总期望次数的比例。类似地,均值向量μ¯jk的估计式是第k个混合元素对观测向量的贡献的期望比例。协方差矩阵U¯jk也有类似的解释。

阅读全文
0 0
原创粉丝点击