CNN-卷积反卷积

来源:互联网 发布:抢演唱会门票软件 编辑:程序博客网 时间:2024/05/16 10:58

在前面的斗图篇我们提过这篇文章《Visualizing and understanding convolutional networks》,这是一片介绍反卷积和可视化的文章,今天我们就来详细看看这篇文章的一个开源实现——来自GitHub - piergiaj/caffe-deconvnet: A deconvolutional network in caffe

首先我们给出上面这篇论文的网络结构架构:


从结构中可以看出,网络首先进行前向计算,在前向计算中收集一些数据,然后将这些数据塞入反向网络中进行反向计算,从而得到最终的反卷积结果。

这其中还包括一些传统网络中没有的层结构——当然不是网络中带有参数的核心层了。以下这张图是这个网络的结构展示以及在前向计算过程中每个层的维度大小:


从这张图可以看出它就是一个经典的AlexNet结构的网络,但是这个层中有一些特殊的层,它们是:

  • PoolingSwitches
  • SliceHalf

这两个层有什么作用呢?实际上它就是一个Pooling层,只不过会多输出一些信息。对于max_pooling来说,它会输出正常的max_pooling值,以及对应的max_pooling的index。这个index信息将会被用在反向计算中。因为反向计算时我们要将diff传输到pooling层前指定的index上,这里要做一个记录。

其中PoolingSwitches就是记录max pooling的值和max pooling选中的index,而SliceHalf则将这两部分分成两个输出,属于SliceLayer的一个特殊实现。

反向计算就是把之前的参数再传输回去,在前面我们已经介绍过这其中的思想了。返回的网络结构如下图所示:


可以看出除了去掉了relu层,反向的结构和前向的结构完全一样。反向中的InvPooling层做了Pooling的的反向计算,其中利用到了前向计算中保存的index值。

0 0
原创粉丝点击