HMM经典介绍论文【Rabiner 1989】翻译（五）——HMM的三个基本问题

来源：互联网发布：淘宝网精品竹制鸟笼编辑：程序博客网时间：2024/05/17 07:45

2.3 HMM的三个问题

在上一小节给出了HMM的形式，在实际应用中还有三个基本问题需要解决，分别是：

问题1：给定观测序列O=O1O2⋯OT和模型λ=(A,B,π)，如何有效地计算P(O|λ)？

问题2：给定观测序列O=O1O2⋯OT和模型λ=(A,B,π)，如何选择最优的状态序列Q=q1q2⋯qT？

问题3：如何调整模型参数λ=(A,B,π)以最大化P(O|λ)？

译者注：这三个问题又被称为概率计算问题、预测问题以及学习问题。

问题1是估计问题，也就是给定模型和观测序列，怎么计算观测序列由这个模型生成的概率。我们也可以把这个问题看成给定模型是否匹配给定观测序列的打分问题。后一种视角更有用。比如考虑这种情况，我们从多个模型中选择，问题1的答案可以让我们选择出最匹配观测序列的模型。

问题2希望得到模型的隐藏部分，即“正确的”状态序列。我们应该清楚并不存在所谓的“正确”状态序列。在实际情况中，我们一般使用一个优化指标来解决这个问题。这个问题的典型应用有为连续语音识别问题找到最优状态序列。

问题3希望优化模型参数以最好描述给定的观测序列是如何得到的。用于调整模型参数的观测序列称为训练序列。训练问题对HMM的应用是非常重要的。

为了对上面的问题有更好的理解，考虑一个简单的孤立单词语音识别器。包含W个单词的词典中，我们希望为每一个单词设计一个N状态HMM。我们把一个单词的语音信号表示为一个编码谱向量的时间序列。假设编码是通过含M个谱向量的谱码本完成的。于是每个观测是与原始语音信号最近的谱向量的索引。对每个单词，我们有一组包含很多重复的该单词编码索引的训练序列。第一个任务是构建独立单词模型。通过解决问题3我们可以得到每个单词模型的模型参数。为了更好地理解模型状态的物理意义，我们用问题2的解决方法来把单词训练序列划分为状态，并学习每个状态下的谱向量的性质。这里的目标是对模型做些微调，比如更多的状态、不同的码本大小等，以提高其对语音单词序列建模的能力。最后，一旦W个HMM设计好并优化之后，基于测试观测序列，利用问题1的解决方法为每个单词模型进行打分来识别一个未知单词，选择得分最高的模型对应的单词作为识别结果。

在下面一节中，我们给出HMM三个基本问题的解决方法。可以看到三个问题在我们的概率框架下是紧密联系的。

阅读全文

0 0