隐马尔可夫模型介绍

来源:互联网 发布:晨风软件工作室 编辑:程序博客网 时间:2024/06/07 00:29

  隐马尔可夫模型是一个双随机过程,其中一个随机过程的状态序列是不可见的,另一个随机过程的状态序列是可见的。

不可见的随机过程符合一般的马尔可夫模型,也就是其当前状态只与其前N个状态有关。可见的当前状态的观测值由当前的不可见状态决定。下图是对隐马尔科夫模型的一个简单描述:


下面用一个例子来简单说明下一阶的隐马尔可夫模型。 

 假设有4个盒子,每个盒子里都装有红白两种颜色的球,盒子里的红白球数由下面表格给出。

盒子1234红球数5368白球数5742


有一个专门的人在后台以一定规则抽取小球,展示给观察者(观察者只能看到球,不知道球从哪个合子里抽的)。 

抽取的规则如下,产生一个球的颜色的观测序列:

1、  刚开始时,从4个盒子里以等概率随机选取1个盒子,从这个盒子里随机抽出1个球,记录其颜色后,放回;

2、  从当前盒子随机转移到下一个盒子,其规则是:如果当前盒子是盒子1,那么下一个盒子一定是盒子2,如果当前是盒子2或3,那么分别以概率0.4和0.6转移到左边和右边的盒子,如果当前是盒子4,那么各以0.5的概率停留在盒子4或转移到盒子3;转移到下一个盒子后,从盒子中随机抽出1个球,记录颜色放回;

3、  重复步骤2直至产生符合长度的观测序列。

假设抽取了5次,产生了{红,红,白,白,红}这么一个序列。


在上面例子中:

盒子对应状态的集合是 

S = {盒子1,盒子2,盒子3,盒子4}

球的颜色对应观测,观测的集合是 

O = {红,白}

状态序列和观测序列长度

T=5

初始概率分布为

 

盒子状态转移概率分布为


观测序列分布为

 

在这个例子中,有两个随机序列,一个是盒子的序列(状态序列),一个是球的颜色的观测序列。前者是不可见的,只有后者是可观测的。这就是一个隐马尔科夫模型。


完整地描述一个隐马尔可夫模型,应当指定状态数N,观测符号数M,以及三个概率密度A、B和π 。这些参数之间有一定的联系,因此为了方便,HMM常用如下方式表示:


1 0