基于图像的人数统计方法

来源：互联网发布：暖通常用数据编辑：程序博客网时间：2024/04/30 17:43

基于图像的人数统计方法大致分为3类：
1、基于个体统计的方法。
现存挑战：光线变化；人群拥挤时个体特征缺失
方法：可以通过摄像机的俯视图，检测人头，有效抗遮挡；人的身躯检测，通过各个人体部位的做检测；头肩模型，根据头肩的“Ω”形状检测。基本方法为HOG+SVM，或者haar特征，hough变换等，或者类圆检测，创新之处一般在特征分析中加入多种特征，在分类中改进SVM，或者用boosting分类器，或者各种分类器的组合。adaboost分类器是最人头检测中最常见的方式。
出入口分析中，首先检测和识别行人，然后跟踪，以过线或者轨迹分析记录是进是出；区域分析是实时检测当前区域的人数。
2、基于人群特征的分析
基于人群特征的分析主要是针对个体分析中人群拥挤个体检测不精确的情况。现存挑战：光线变化；高密度人流或者开阔场景下计数不精确，行人检测处理时间较长；摄像头“远小近大”造成的透视。
方法：
feature extration:Foreground segment features(Area,perimeter,perimeter edge orientation,perimeter -area ratio);Edge features(total edge pixel,edge orienation,Minkowski dimention );Texture feature(homogeneity,energy,entropy)另外，特征有全局特征和局部特征之分，全局特征是指图像整体的特征，如颜色直方图、梯度直方图等，局部特征是指前景特征，如surf特征、边缘特征等。特征还分为high-lever feature和low-lever feature，high-lever feature是指像head detector等，low-lever feature指像
特征提取之后，特征回归，回归的方法一般为SVR、高斯回归、最小二乘法、岭回归等。
创新之处：特征提取，对不同的特征做结合或者特征聚类，在聚类方法上做创新；回归过程的创新主要体现在对不同的特征选用不同的和核函数回归；由于数据集的数量
3、基于卷积神经网络的人数统计方式
利用深度网络学习的图像特征，使其相较于传统图像特征有更强的泛化性、代表性。比如安徽大学一篇硕士论文采用包含三层卷积和一层全连接层，其中每层卷积后都跟随有池化操作而激活函数则选用ReLU 函数。

实际操作
利用特征提取的方式做回归，可以先做运动目标提取，得到二值图，然后统计前景特征，keypoints的提取，可以是surf点的个数，也可以是LBP的熵等统计特征，把这些特征和实际人数回归。

在数据集中，有已经做好的特征，想验证回归方式的话，可以利用这些已经提取好的特征，数据集UCSD Pedestrian Dataset提供了这些特征ucsdpeds_feats。
Chan A B, Vasconcelos N. Counting people with low-level features and Bayesian regression.[J]. IEEE Transactions on Image Processing A Publication of the IEEE Signal Processing Society, 2012, 21(4):2160.论文中，利用贝叶斯泊松回归做预测，取得了很好的效果。在该分析中，对核函数和回归过程做了比较，所以研究回归的话，这篇论文是不错的选择。

UCSD Pedestrian Dataset下载链接
综述类型的文章，非深度学习的方法，参见 An evaluation of crowd counting methods, features and regression models ☆[J]. Computer Vision & Image Understanding, 2015, 130(C):1-17.
基于卷积神经网络的方法，参见Sindagi V A, Patel V M. A survey of recent advances in CNN-based single image crowd counting and density estimation[J]. Pattern Recognition Letters, 2017.论文
关于特征的文章，参见Chen K, Chen C L, Gong S, et al. Feature Mining for Localised Crowd Counting[C]// British Machine Vision Conference. 2012.
除了公开的数据集之外，安徽大学、上海科技大学也分别做出了自己的数据集，可以在官网下载。
数据集给出的一般为标注好的图像，标注了点坐标，或者为行人头部的矩形坐标。利用这些做好的标注，生成密度图。深度网络的输入是人群图片，输出是密度图，积分获得人数。或者直接输入是图，输出是人数。（关于卷积的具体操作，还有带进一步验证。）

做人数统计，有MATLAB的模式识别和深度学习工具箱，opencv自带的SVM分类器，caffe框架等，GitHub上可以搜到相关的程序和标注好的数据集。

阅读全文

0 0