Shallow and Deep Convolutional Networks for Saliency Prediction

来源：互联网发布：工业视觉软件编辑：程序博客网时间：2024/05/18 04:27

CVPR 2016
Shallow and Deep Convolutional Networks for Saliency Prediction
CNN网络用于显著性预测

开源代码： https://github.com/imatge-upc/saliency-2016-cvpr

本文针对显著性预测问题，提出了两个CNN网络，一个小的模型，一个较深的模型。

视觉显著性指智能算法通过模拟人的视觉特点，标注出图片中的显著区域（算法认为的人类感兴趣的区域）。如下图所示：
这里写图片描述

当前CNN网络在计算机视觉各个领域大行其道，很自然的想将其应用于显著性检测，但是与图像分类问题相比较，显著性检测问题有其独特性：
1）大量训练数据问题，显著性检测训练数据的标记更繁琐。所幸最近有两个相关的数据库被公布。解决了训练数据问题
2）显著性检测问题需要输出每个像素的saliency score。也就是说我们CNN网络最后的输出和原始图像尺寸一样大小。

3 Shallow Convnet

这里写图片描述

这里我们采用了各种策略防止模型过拟合。

4 Deep Convnet

这里写图片描述

这里一共10层，前三层网络使用 VGG预训练的参数。
这里我们经过各种尝试发现：
1）加入更多网络层可以提高精度
2）每个网络层使用更多的特征maps 同样提高精度
3）使用 dropout 正定没有显著提高精度，但是增加了训练时间。

最终的网络设计主要受一下因素影响：输入图像尺寸，网络层数， GPU内存。

这里写图片描述

0 0