《Very Deep Convolutional Networks for Large-Scale Image Recogition》

来源:互联网 发布:mac pro忘记登录密码 编辑:程序博客网 时间:2024/06/05 02:32

Architecture

固定输入224*224,预处理为减均值。
本文没有使用LRN,理由是没有提升网络的表现,同时增加计算和储存负担。

Configurations

卷积层的深度在每一个max-pooling之后都增加一倍,从第一层的64到之后一层的512。

Discussion

相比于AlexNet(11*11)和ZFNet(7*7)大的卷积核,本文使用更小的卷积核(3*3),理由:
一:
receptive field计算公式:(outsize-1)*stride+ksize
one 3*3 conv:3*3
two 3*3 conv:(3-1)*1+3=5
three 3*3 conv:(5-1)*1+3=7
三层3*3的conv的receptive field == 一层7*7的conv的recptive field
二:
比一个7*7的conv,三个3*3的conv多了2个非线性层,增加了网络的非线性表达能力。
三:
减小了网络的参数,假设网络的channel有C个,三个3*3的conv的参数为27C2,一个7*7的conv的参数为49C2
1*1的conv的使用,让网络在不增加receptive field的前提下,引入了非线性,同时有升维/降维的功能(本文并没有)。

阅读全文
0 0
原创粉丝点击