计算机视觉目标检测的框架

来源:互联网 发布:流体仿真软件 编辑:程序博客网 时间:2024/06/05 10:11

目标的检测大体框架:
一、基于传统方法
流程为:特征提取+分类器
常用特征:
haar、LBP、HOG、Gabor、ACF、ICF等
常见组合:
haar+adaboost
lbp+adaboost
Hog+SVM

常用分类器:
SVM, adaboost

基于传统方法目标检测分为以下几个步骤:
1、训练分类器所需训练样本的创建
2、特征提取、归一化
3、用特征向量来训练分类器
4、利用训练好的分类器进行目标检测(滑动窗口检测)
5、学习和改进分类器(hard-mining)

二、基于深度学习方法
1)、候选区域proposals+分类classify
Faster rcnn 系列。
1、提取候选区域(rpn网络或者传统方法selective search)
2、将ROI pooling后的候选框送入cnn网络中进行分类、同时进行检测框的精确位置回归。
MTCNN。
用多级小网络生成和筛选候选框,同时进行检测框的精确位置回归。在最后一个网络中增加了关键点的回归。

2)、基于回归方法
YOLO,SSD等。
1、直接回归检测框的坐标
3)混合
Mask-Rcnn等。
Mask-Rcnn:在Faster-rcnn的基础上增加了图像分割分支,即基于像素点的分类。