Residual Attention Network for Image Classification, cvpr17

来源:互联网 发布:oracle数据库参数 编辑:程序博客网 时间:2024/06/06 01:16

人至懒则无敌。

cvpr17的论文,很有意思,值得一读和复现。(笔者懒,还是坐等开源吧)

Residual Attention Network for Image Classification. In CVPR 2017.

该模型的结构参考了: Stacked hourglass networks for human pose estimation. In arXiv 2016. (笔者强烈推荐)

yangshuo的page: http://personal.ie.cuhk.edu.hk/~ys014/


还是老样子,看图说话,具体细节,请看论文。


图1说明了越high-level的part feature及其mask越会focus在object或者parts of object上。而且通过mask,可以diminish不相关的区域,如背景。



图2是网络架构,其关键点在于hourglass的attention map以及attention和trunck branches的residual connection。具体的细节和公式请看论文,容易理解。下面的图3比较详细地说明了soft mask branch和trunk branch是怎样的子结构。


至于效果嘛,看下面的tab 7


笔者简单套用了下residual这个方式,即(1+M(X))*T(X)到笔者的一个task上,发现是有1%的提升的。


=====
如果这篇博文对你有帮助,可否赏笔者喝杯奶茶?



0 0