概率占据图算法(POM)介绍

来源:互联网 发布:简单企业网站源码 编辑:程序博客网 时间:2024/05/20 00:11

缘起

这个算法在国内不多见,百度谷歌也没有看到相关的资料,感觉这个算法是变分法在贝叶斯框架下的视觉算法中的一个很好的应用,所以就把自己以前整理的一些内容贴出来了。

什么是POM

Probabilistic Occupancy Map, 用于计算物体在平面上存在的概率,原文见[1],代码见[2]。多个相机从不同角度监控同一场景,POM通过各视角运动检测后的结果(二值图像)计算所监控平面上运动物体出现的概率。具体地,首先将被监控平面划分为等大小的矩形,每个矩形上有无物体(行人,后文不区分)的事件表示为Xi,当Xi=1时表示有行人,否则无,POM可得到Pr(Xi=1)使下式最大:

Pr(X1,X2,,XN|I1,I2,,IC),

其中,N表示地面矩形的个数,Ii表示图像(或运动检测后的结果),C为相机的个数。

建模

根据贝叶斯公式,有:

Pr(X1,X2,,XN|I1,I2,,IC)=Pr(I1,I2,,IC|X1,X2,,XN)Pr(X1,X2,,XN),

似然度Pr(I1,I2,,IC|X1,X2,,XN)文中建立为指数模型,即用矩形框近似运动检测结果,并将对比结果作为自然底数e的指数。先验建立为平均分布。

求解

变分法,可参考[3]。

说明

POM的运行速度很慢,文中通过积分图加速POM的计算,可实际运行结果仍然很慢(1280×1024的图像,4个视角,大概十几秒处理一帧),不能实时运行,对一般监控任务而言不适用。但感觉这个方法相比一般多视角定位的方法,理论简洁,效果良好。期待并行算法的出现!

参考

[1] FLEURET F., BERCLAZ J., LENGAGNE R., et al. Multicamera People Tracking with a Probabilistic Occupancy Map. IEEE Transactions on Pattern Analysis and Machine Intelligence [J], 2008, 30(2): 267 ∼ 282.

[2] http://cvlab.epfl.ch/software/pom

[3] BISHOP C. M. Pattern Recognition and Machine Learning [M]. Springer, 2006.

0 0