HMM经典介绍论文【Rabiner 1989】翻译（十）——连续观测密度

来源：互联网发布：淘宝工商银行不能付款编辑：程序博客网时间：2024/05/17 01:06

4.1 连续观测密度

目前为止我们的讨论中只考虑了观测是离散值的情况，这种情况下对每个状态可以使用离散概率密度。但是存在一些应用离散值是连续信号（比如向量）。虽然可以通过码本把连续信号量化，但是这种量化可能存在严重的退化。所以希望HMM中可以用连续观测密度。

为了使用连续观测密度，必须对模型概率密度函数(probability density function, pdf)进行约束以使得pdf的参数可以通过一致的方法进行估计。最一般的pdf的表示是如下的有限混合形式：

b i (O) = \sum m = 1 M c j m f [O, μ j m, U j m], 1 \leq j \leq N (49)

其中O是被建模的向量，cjm是在状态j的第m个混合的系数，f是log-凹或者椭圆对称密度（比如高斯），μjm和Ujm分别为状态j下第m个混合的均值向量和协方差矩阵。一般f为高斯密度。混合增益cjm满足随机约束：

\sum m = 1 M c j m = 1, 1 \leq j \leq N (50a)

c j m \geq 0, 1 \leq j \leq N, 1 \leq m \leq M (50b)

以使得pdf被正确归一化，即

\int \infty - \infty b j (x) d x = 1, 1 \leq j \leq N . (51)

(49)表示的pdf可以任意近地近似任一有限连续密度函数。所以可以用于解决很多问题。

混合密度系数的估计公式为

c j k ¯ = \sum T t = 1 γ t ( j , k ) \sum T t = 1 \sum M k = 1 γ t ( j , k ) (52)

μ ¯ j k = \sum T t = 1 γ t ( j , k ) \cdot O t \sum T t = 1 γ t ( j , k ) (53)

U ¯ j k = \sum T t = 1 γ t ( j , k ) \cdot ( O t - μ j k ) ( O t - μ j k ) ' \sum T t = 1 γ ( t j , k ) (54)

其中′表示向量转置，γt(j,k)是用第k个混合元素解释Ot 时，t时刻状态为j的概率，即

γ t (j, k) = ⎡ ⎣ α t ( j ) β t ( j ) \sum N j = 1 α t ( j ) β t ( j ) ⎤ ⎦ ⎡ ⎣ c j k f ( O t , μ j k , U j k ) \sum M m = 1 c j m f ( O t , μ j m , U j m ) ⎤ ⎦ .

γt(j,k)在只有一个混合的时候泛化为(26)中的γt(j)。aij的估计表达式和离散观测密度时的一样（(40b)）。cjk的估计式是当使用第k个混合元素时系统在状态j的期望次数与系统在状态j的总期望次数的比例。类似地，均值向量μ¯jk的估计式是第k个混合元素对观测向量的贡献的期望比例。协方差矩阵U¯jk也有类似的解释。

阅读全文

0 0