卷积核问题

来源:互联网 发布:日本人的气质 知乎 编辑:程序博客网 时间:2024/06/07 04:08
在卷积神经网络中,卷积核到底是几层的?
一般而言,深度卷积网络是一层又一层的。层的内存本质是输入数据及其中间表示值。一组卷积核则是联系前后两层的网络结构表达实体,训练的目标就是每个卷积核的一组权重参数。
描述网络模型中某层的厚度,通常用名词通道channel数或者特征图feature map数。不过人们更习惯把作为数据输入的前层的厚度称之为通道数(比如RGB三色图层称为输入通道数为3),把作为卷积输出的后层的厚度称之为特征图数。
卷积核filter一般是3D的,除了面积参数比如3x3之外,还有厚度参数H(2D的视为厚度1)和卷积核的个数N。
卷积核的厚度H, 一般等于前层厚度M(输入通道数,或前层feature map数);不一般的情况M > H。
卷积核的个数N,等于后层厚度(后层feature maps数,也用N表示)。
卷积核通常从属于后层,为后层提供了各种查看前层特征的视角,这个视角是自动形成的。

卷积核厚度等于1时为2D卷积,对应平面点相乘然后把结果加起来,相当于点积运算;
卷积核厚度大于1时为3D卷积,每片分别平面点求卷积,然后把每片结果加起来,作为3D卷积结果;1x1卷积属于3D卷积的一个特例,有厚度无面积。
归纳之,卷积的意思就是把一个区域,不管是一维线段,二维方阵,还是三维长方块,全部按照卷积核的维度形状,对应逐点相乘后求和,浓缩成一个标量值也就是降到零维度,作为下一层的一个feature map的一个点的值!
lizi
可以想象一群渔夫坐一个渔船撒网打鱼,鱼塘是多层水域,每层鱼儿不同。
船每次移位一个stride到一个地方,每个渔夫撒一网,得到收获,然后换一个距离stride再撒,如此重复直到遍历鱼塘。
A渔夫盯着鱼的品种,遍历鱼塘后该渔夫描绘了鱼塘的鱼品种分布;
B渔夫盯着鱼的重量,遍历鱼塘后该渔夫描绘了鱼塘的鱼重量分布;
还有N-2个渔夫。。。。各干各的,没人知道他们想什么;
最后得到N个特征图,描述了鱼塘的一切,包括水草!
2D卷积表示渔夫的网就是带一圈浮标的渔网,只打上层水体的鱼;
3D卷积表示渔夫的网是多层嵌套的渔网,上中下层水体的鱼儿都跑不掉;
1x1卷积可以视为每次移位stride,钓鱼代替了撒网;

解释不一般的情况M > H:
实际上,除了输入数据的通道数比较少之外,中间层的feature map数很多,这样中间层算卷积会累死计算机(鱼塘太深,每层鱼都打,需要的鱼网太重了)。所以很多深度卷积网络把通道做了分组,每个卷积核不看全部通道了(渔夫A的渔网只打捞深水段,渔夫B的渔网只打捞浅水段)。这样会看到整个深度网络架构是横向开始分道扬镳了,到后面才又融合。这样看来,很多网络模型的架构不是突发奇想,而是是被计算量逼得。
原创粉丝点击