Shallow and Deep Convolutional Networks for Saliency Prediction
来源:互联网 发布:工业视觉软件 编辑:程序博客网 时间:2024/05/18 04:27
CVPR 2016
Shallow and Deep Convolutional Networks for Saliency Prediction
CNN网络 用于 显著性预测
开源代码 : https://github.com/imatge-upc/saliency-2016-cvpr
本文针对显著性预测问题,提出了两个CNN网络,一个小的模型,一个较深的模型。
视觉显著性指智能算法通过模拟人的视觉特点,标注出图片中的显著区域(算法认为的人类感兴趣的区域)。如下图所示:
当前CNN网络在计算机视觉各个领域大行其道,很自然的想将其应用于显著性检测,但是与图像分类问题相比较,显著性检测问题有其独特性:
1)大量训练数据问题,显著性检测训练数据的标记更繁琐。所幸最近有两个相关的数据库被公布。解决了训练数据问题
2)显著性检测问题需要输出每个像素的saliency score。也就是说我们CNN网络最后的输出和原始图像尺寸一样大小。
3 Shallow Convnet
这里我们采用了各种策略防止模型过拟合。
4 Deep Convnet
这里一共10层,前三层网络使用 VGG预训练的参数。
这里我们经过各种尝试发现:
1)加入更多网络层可以提高精度
2)每个网络层使用更多的特征maps 同样提高精度
3) 使用 dropout 正定没有显著提高精度,但是增加了训练时间。
最终的网络设计主要受一下因素影响: 输入图像尺寸,网络层数, GPU内存。
0 0
- Shallow and Deep Convolutional Networks for Saliency Prediction
- Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps 中文翻译
- Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps 中文翻译
- 论文阅读《Multi-Scale Dense Convolutional Networks for Efficient Prediction 》
- 【Deep Learning】genCNN: A Convolutional Architecture for Word Sequence Prediction
- Visual Saliency Prediction with Generative Adversarial Networks
- Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
- Very Deep Convolutional Networks for Large-Scale Image Recognition
- Very Deep Convolutional Networks for Large-Scale Image Recognition(精读)
- Very Deep Convolutional Networks for Large-Scale Image Recognition
- Very Deep Convolutional Networks for Large-Scale Image Recognition
- Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
- very deep convolutional networks for large-scale image recognition---vggnet
- VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION
- 论文Very Deep Convolutional Networks for Large-Scale Image Recognition
- Very Deep Convolutional Networks for Large-Scale Image Classification
- Very deep convolutional networks for large-scale image recognition
- Very Deep Convolutional Networks for Large-Scale Image Recognition
- C#控制台基础 helloworld之 派生类出现同名方法,通过调用基类的方法输出
- spring-data-elasticsearch api
- 关于Android的layout_weight
- 解决方案-支持各种屏幕密度
- CopyOnWriteArrayList与Collections.synchronizedList的性能对比
- Shallow and Deep Convolutional Networks for Saliency Prediction
- iOS开发:相对路径与相对工程名
- 做SEO的我们是必要先了解看搜索引擎的工作原里
- android标题栏详细讲解(1,2)
- Linux IPC之Socket网络编程基础篇
- PHP中遍历数组元素的几种方法
- Java关键字final、static使用总结
- SQL数据库备份恢复助手 V2.7.6 官方免费版
- Eclipse下启动tomcat报错:The archive: C:/Program Files(x86)/Java/jdk1.7.0_10/lib/tools.jar which is refere