VGGNet笔记

来源:互联网 发布:考研有多难放弃知乎 编辑:程序博客网 时间:2024/06/01 10:06

卷积网络配置

  1. 结构
    输入:224×224×3的RGB图像
    预处理:在训练集中,把每个像素减去均值
    卷积核:只使用了3×3和1×1两种。
    (3×3的核:最小的可以捕捉空间信息的核;1×1的核:看作对输入的线性变换)
    步长:1
    padding:1,即保持分辨率不变的same padding
    池化:5个max-pooling,窗口2×2,步长为2
    然后3个FC层,最后一个softmax
    非线性激活函数全部是ReLU函数
    第一次吐槽LRN没有用

  2. 配置
    这里写图片描述

  3. 讨论
    作者认为,
    2个3×3的核≈1个5×5的核
    3个3×3的核≈1个7×7的核
    好处有2点:
    1.能使decision function更有辨识力
    2.减少参数
    然后解释1×1卷积核的用处:增加decision function的非线性性,同时不影响conv.层的感受野(因为就算1×1的卷积核也应用了ReLU函数),关于1×1卷积核详见”Network in Network”