ImageNet Classification with Deep Convolutional Neural Networks 阅读理解及问题

来源：互联网发布：斑马梦龙网络计划编辑：程序博客网时间：2024/04/30 07:12

看了这篇论文和网上的阅读笔记，还没看代码。有一些问题列在这里，看看自己以后能不能回答。

1. 用GPU加速训练，论文提到是用GPU做2D卷积，而实际的网络都是3D的卷积计算，这个怎么对应？怎样计算3D卷积？

2. 论文中的深度CNNs使用激活函数f(x) = max(0, x), 称为ReLU Nonlinearity。这比sigmoid、双曲正切作为激活函数在训练速度上要快好几倍。那么ReLU在哪些模型上比较适用？是否能说在深度CNNs的训练上都可以用ReLU代替sigmoid? 毕竟在训练速度上有很大的优势。

3. CNN结构图如下

第4、5个卷积层和第3个卷积层的特征图大小相同（13X13），论文说它们之间没有正则化和池化运算，这么说只做了卷积运算？卷积运算不改变特征图大小？如果是这样那么第一层的大小55X55怎么算的，怎么不是56X56（224/4=56）？

4. 在防止过拟合所采用的方法中，altering the intensities of the RGB channels这一步没看明白，这里对哪个对象做PCA？是每个像素、每张图还是整个训练集？

0 0