隐马尔科夫模型——学习算法

来源：互联网发布：装修效果软件手机软件编辑：程序博客网时间：2024/06/05 02:18

前言

隐马尔科夫模型有三个基本问题：概率计算问题，学习问题，预测问题。本博客介绍学习问题的监督学习算法和非监督学习算法（EM算法）。阅读本文前请先学习基本概念。

学习问题是一直观测序列O=(o1,o2,...,oT)，估计模型λ=(A,B,π)参数，使得在该模型下观测序列概率P(O|λ)最大。

如果训练数据是观测序列和对应的状态序列，由监督学习实现；如果观测数据只有观测序列，由非监督学习实现。

训练数据包括S个观测序列和与观测序列对应的状态序列对{(O1,I1),(O2,I2),...,(OS,IS)}，利用极大似然估计法来估计隐马尔科夫模型参数。

首先，解释一下什么是极大似然估计。

极大似然估计，又被称之为最大似然估计（Maximum Likelihood
Estimate，MLE），通俗地来说，就是利用已知样本结果信息，反推最有可能（最大概率）导致样本结果出现的模型参数。一句话总结：模型已定，参数未知。

对参数进行推断，称之为“似然”，得到最可能的模型参数，称之为“最大似然估计”

举一两个生活的例子（o(￣︶￣)o）：

举一个比较专业的例子：（知乎上看到的）

有一个箱子，里面只有黑白两种球，一共100个球，但黑白球各自数量不知。每次抽取一球然后放回重新抽取。重复试验100次后，发现有70次抽取到的是白球，剩下30次是黑球。问：箱子里白球的数量最可能是多少？
从一个“门外汉”的角度，第一反应是70。从专业的数学角度，假设抽取了70次白球，30次黑球的概率用P(样本结果|Model)表示，第i次抽样结果用xi表示，p表示一次抽样结果是白球的概率，则
$P (样本结果 | M o d e l) = P (x 1, x 2, . . ., x 100 | M o d e l) = P (x 1 | M o d e l) P (x 2 | M o d e l) . . . P (x 1 00 | M o d e l = p 70 (1 - p) 30$ 最后的p70(1−p)30就是我们得到的似然函数。似然函数最大时（即样本出现的概率最大），此时对应的p值就是我们要找的模型参数。对该似然函数求导，令导数为0，得到p对应值为0.7。

关于似然函数，需要知道：

1.转移概率aij的估计：

a i j = A i j \sum N j = 1 A i j

其中，

Aij代表样本中时刻t处于状态i时刻t+1处于状态j的频数。
2.观测状态

bj(k)的估计：

b j (k) = B j k \sum M k = 1 B j k

其中，

Bjk代表状态为j观测为k的频数。
3.初始状态概率

πi的估计为S个样本中初始状态为

qi的频率。

稍微说一下什么是拉格朗日乘子法

拉格朗日乘子法：将约束条件函数与原函数联立，从而求出使原函数取得极值的各个变量的解。

后面我就不详细写了，这位大神写的太好了隐马尔可夫模型之Baum-Welch算法详解

还是那句话，数学，数学啊，得好好补数学了。。。。

阅读全文

0 0