PSPnet:Pyramid Scene Parsing Network
来源:互联网 发布:网络拓扑图图标素材包 编辑:程序博客网 时间:2024/06/15 18:14
首先声明,文末彩蛋,不是笔者提问的
1 一句话总结
作者认为现有模型由于没有引入足够的上下文信息及不同感受野下的全局信息而存在分割出现错误的情景,于是,提出了使用global-scence-level的信息的pspnet,另外本文提出了引入辅助loss的ResNet优化方法。
2 网络结构
本文提出的网络结构简单来说就是将DeepLab(不完全一样)aspp之前的feature map pooling了四种尺度之后 将5种feature map concat到一起经过卷积最后进行prediction的过程。
3 ResNet
本文除了网络之外,其ResNet的模型还是挺强的
如上图,首先作者在训练的时候加入了辅助loss,另外ResNet起始的7x7的卷积替换了三个3x3的卷积
4 实施细节
- 使用了poly的学习策略,learning rate 0.01,power 0.9
- momentum 0.9 weight decay 0.0001
- random mirror
- random resize [0.5,2]
- random rotation [-10 degree,10 degree]
- random gaussian blur
- new caffe (batch size 16)
- auxiliary loss weight to 0.4
5 Ablation study
作者通过实验,验证了文中各种设置的作用
5.1 psp net的作用(包括pooling的形式及数量)
5.2 auxiliary loss
5.3 pre-trained model
5.4 其他
6 知乎上的讨论
0 0
- PSPnet:Pyramid Scene Parsing Network
- 【PSPNet】Pyramid Scene Parsing Network
- PSPNet(Pyramid Scene Parsing Network)
- Pyramid Scene Parsing Network - arxiv - 1612.01105
- [Paper note] Pyramid Scene Parsing Network
- Pyramid Scene Parsing Network(PSP NET)
- 场景解析--Pyramid Scene Parsing Network
- Pyramid Scene Parsing Network论文解读
- Reading Note: Pyramid Scene Parsing Network
- 场景解析--Pyramid Scene Parsing Network
- 论文阅读:《Pyramid Scene Parsing Network》CVPR 2017
- Scene Parsing
- PSPNet
- 场景解析--Scene Parsing through ADE20K Dataset
- Spatial Pyramid Matching for Recognizing Natural Scene Categorie(阅读)
- FPN Feature Pyramid Network for Object Detection
- Performing Network Operations - Parsing XML Data
- 关于2006_CVPR_Beyond Bags of Features Spatial Pyramid Matching for Recognizing Natural Scene Categorie
- C++拷贝构造函数详解
- UVa-10340
- linux xargs传递参数
- Ubuntu14.04+GTX980 Ti+cuDNN 5.1
- 跟小博老师一起学Servlet ——Servlet之属性操作2
- PSPnet:Pyramid Scene Parsing Network
- opencv学习_6 (灰度直方图)
- Dlib编译与搭建
- C++-继承:构造函数和析构函数
- mysql数据库下行列转换笔记
- Java并发编程:volatile关键字解析
- JS:库存更新程序
- 洛谷P2992 [USACO10OPEN]三角形计数Triangle Counting
- 博客第一天