《Very Deep Convolutional Networks for Large-Scale Image Recogition》

来源：互联网发布：mac pro忘记登录密码编辑：程序博客网时间：2024/06/05 02:32

Architecture

固定输入224*224，预处理为减均值。
本文没有使用LRN，理由是没有提升网络的表现，同时增加计算和储存负担。

Configurations

卷积层的深度在每一个max-pooling之后都增加一倍，从第一层的64到之后一层的512。

Discussion

相比于AlexNet（11*11）和ZFNet（7*7）大的卷积核，本文使用更小的卷积核（3*3），理由：
一：
receptive field计算公式：（outsize-1)*stride+ksize
one 3*3 conv：3*3
two 3*3 conv：(3-1)*1+3=5
three 3*3 conv：(5-1)*1+3=7
三层3*3的conv的receptive field == 一层7*7的conv的recptive field
二：
比一个7*7的conv，三个3*3的conv多了2个非线性层，增加了网络的非线性表达能力。
三：
减小了网络的参数，假设网络的channel有C个，三个3*3的conv的参数为27C2，一个7*7的conv的参数为49C2
1*1的conv的使用，让网络在不增加receptive field的前提下，引入了非线性，同时有升维/降维的功能（本文并没有）。

阅读全文

0 0