Shallow and Deep Convolutional Networks for Saliency Prediction

来源:互联网 发布:工业视觉软件 编辑:程序博客网 时间:2024/05/18 04:27

CVPR 2016
Shallow and Deep Convolutional Networks for Saliency Prediction
CNN网络 用于 显著性预测

开源代码 : https://github.com/imatge-upc/saliency-2016-cvpr

本文针对显著性预测问题,提出了两个CNN网络,一个小的模型,一个较深的模型。

视觉显著性指智能算法通过模拟人的视觉特点,标注出图片中的显著区域(算法认为的人类感兴趣的区域)。如下图所示:
这里写图片描述

当前CNN网络在计算机视觉各个领域大行其道,很自然的想将其应用于显著性检测,但是与图像分类问题相比较,显著性检测问题有其独特性:
1)大量训练数据问题,显著性检测训练数据的标记更繁琐。所幸最近有两个相关的数据库被公布。解决了训练数据问题
2)显著性检测问题需要输出每个像素的saliency score。也就是说我们CNN网络最后的输出和原始图像尺寸一样大小。

3 Shallow Convnet

这里写图片描述

这里我们采用了各种策略防止模型过拟合。

4 Deep Convnet

这里写图片描述

这里一共10层,前三层网络使用 VGG预训练的参数。
这里我们经过各种尝试发现:
1)加入更多网络层可以提高精度
2)每个网络层使用更多的特征maps 同样提高精度
3) 使用 dropout 正定没有显著提高精度,但是增加了训练时间。

最终的网络设计主要受一下因素影响: 输入图像尺寸,网络层数, GPU内存。

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

0 0
原创粉丝点击