我读DenseNet

来源：互联网发布：淘宝网正规催情药编辑：程序博客网时间：2024/05/16 14:56

背景

之前听说过DenseNet，再次被提起是因为七月初上交大主办的SSIST 2017，Yann Lecun的一页PPT，将其地位放置到如此之高，查了一下是CVPR 2017的一篇Oral，于是下定决心好好拜读一下。1
这里写图片描述
文章地址：https://arxiv.org/abs/1608.06993
代码地址：Torch版本，TensorFlow版本，MxNet版本，Caffe版本，

方法

我们回顾一下ResNet，大意就是本层的激活值与本层的输入，作为本层的输出。换一种方式理解，第l层的激活值不仅仅影响l+1层，而且还影响l+2层。那么由此及广，我们可不可以让第l层的激活值一直影响到第l+k层呢？这样就有了本文的基本思想，稠密就是从这里产生。好处如下：
这里写图片描述

与传统的卷积网络相比，需要更少的参数就能得到相同的效果。这里指出一点，参数少并不意味计算量降低，实验前向速度并未比ResNet降低。作者给出的原因是每层的输入包括之前的所有层，所以可以避免传统网络中冗余的层；
Densenet改变了传统网络反向传递时，梯度（信息）传播方式，由线性变成树状反向，这样的好处就在于减少了梯度消失的可能，并且加速训练，有利于更深层网络的训练；
作者发现稠密的网络结构有类似正则功能，在小数据集合上更好的避免过拟合。