论文笔记:Very Deep Convolutional Networks for Large-Scale Image Recognition

来源：互联网发布：mac深圳专柜地址编辑：程序博客网时间：2024/06/08 02:23

摘要：

论文研究了卷积神经网络的深度对图像识别的准确率的影响。论文的主要贡献是使用非常小(3*3)的卷积滤波器架构对增加网络深度全面评估，表明通过将深度推到16-19个权重层可以实现显著提升。

一.简介：

论文固定了架构的其他参数，通过添加更多的卷积层来增加网络的深度，这种方法可行是因为在所有层中都使用了非常小的(3*3)的卷积滤波器。

二.网络配置：

2.1架构：

论文做的唯一的预处理是从每个像素值上减去在训练集上计算的平均RGB值。论文使用具有非常小的感受野的滤波器：3*3（这是捕获左/右、上/下、中心、概念的最小尺寸）。

2.2配置：

卷积层的宽度（通道的数量）越来越大，从第一层的64个开始，在每个最大池化层之后乘2，直到其达到512。

2.3讨论：

在整个网络中使用了非常小的3*3的感受野，对输入中的每一个像素进行卷积处理（步长为1）。很容易看到两个3*3的卷积层（中间不带空间池化）和一个5*5的卷积层具有相同的感受野（就是说假如输入是5*５的图像，用3*3的filter卷积之后输入图像变成3*3，再来一个3 * 3 的filter卷积后输入图像变成1*1 。这和直接用一个5*5的filter卷积图像是一样的效果）。3个这样的层就相当于有一个7*7的感受野。所以我们通过使用例如三个3*3卷积层的堆叠而不是单个的7*7的卷积层获得了什么？

第一，引入了三个非线性修正层，而不是一个，使得决策函数更加有辨别力。

第二，减少了参数的数量。

这可以看成是对7*7的卷积滤波器加了一个正则化，迫使它们通过3*3滤波器（在其间注入非线性）进行分解。

阅读全文

0 0