HMM经典介绍论文【Rabiner 1989】翻译（七）——预测问题

来源：互联网发布：foursqure 数据集下载编辑：程序博客网时间：2024/04/29 21:08

3.2 问题2的求解（预测问题）

有多种方法可以求解与观测序列相关的最优状态序列。难度在于最优状态序列的定义，因为有多种优化指标。比如，可以独立地为每个时刻t选择最有可能的状态qt。这个优化指标最大化正确状态的期望个数。定义变量

γ t (i) = P (q t = S i | O, λ), (26)

即给定模型λ和观测序列O，在时刻t状态为Si的概率。公式(26)可以用前向-后向变量来表示：

γ t (i) = α t ( i ) β t ( i ) P ( O | λ ) = α t ( i ) β t ( i ) \sum N i = 1 α t ( i ) β t ( i ) . (27)

分母是归一化因子，使得γt(i)满足概率性质：

\sum i = 1 N γ t (i) = 1. (28)

利用γt(i),我们可以求解在时刻t最有可能的状态qt：

q t = arg max 1 \leq i \leq N [γ t (i)], 1 \leq t \leq T . (29)

尽管(29)最大化正确状态的期望个数，但是得到的状态序列是有问题的。当有些HMM状态转移概率为0时，最优状态序列可能不是一个有效的状态序列。这是因为(29)只简单地确定每个时刻最优可能的状态，没有考虑状态序列出现的可能性。

一个可能的解决方法是修改这个优化指标。比如，通过最大化正确状态对(qt,qt+1)的个数来求解状态序列。虽然这类指标对可能对某些应用是合理的，但是使用最广泛的指标是找到最好的状态序列，即最大化p(Q|O,λ)，等价于最大化P(Q,O|λ)。动态规划可以用于求解这个优化问题，在这里被称为Viterbi算法。

Viterbi算法：为了找到观测序列O={O1O2⋯OT}的最优状态序列Q={q1q2⋯qT}，我们定义

δ t (i) = max q 1, q 2, \dots, q t - 1 P [q 1 q 2 \dots q t = i, O 1 O 2 \dots O t | λ], (30)

δt(i)是在时刻t状态为Si的且到t时刻观测序列为O1O2⋯Ot的所有路径中概率最大的那个。通过递推，可以得到

δ t + 1 (j) = [max i δ t (i) a i j] \cdot b j (O t + 1) . (31)

为了得到状态序列，我们需要保存使(31)最大的参数，即每个时刻t对应的j。这可以通过一个数组ψt(j)实现。完整Viterbi算法是：

1）初始化：

δ 1 (i) = π i b i (O 1), 1 \leq i \leq N (32a)

ψ 1 (i) = 0. (32b)

2）递归：

δ t (j) = max 1 \leq i \leq N [δ t - 1 (i) a i j] b j (O t), 2 \leq t \leq T, 1 \leq j \leq N (33a)

ψ t (j) = arg max 1 \leq i \leq N [δ t - 1 (i) a i j], 2 \leq t \leq T, 1 \leq j \leq N . . (33b)

3）终止：

P * = max 1 \leq i \leq N [δ T (i)] (34a)

q * T = arg max 1 \leq i \leq N [δ T (i)] . (34b)

4）路径回溯：

q * t = ψ t + 1 (q * t + 1), t = T - 1, T - 2, \dots, 1. (35)

Viterbi算法和前向计算过程有点类似，主要区别在于(33a)中的最大化替代了(20)中的求和。

阅读全文

0 0