卷积与反卷积

来源：互联网发布：程序员美剧编辑：程序博客网时间：2024/05/18 01:42

以下属于个人见解和总结，不妥之处还望指教。
[Toc]

卷积(Convolution)

卷积定义：图像中的卷积，可以理解为在空间位置上，进行加权叠加。

——[图片来源]

假设输入特征层feature map的大小为[batch,width,height,channel]，卷积核大小[k,k,inputn,outputn]，步长为[1,s,s,1], padding大小为p, 则通过卷积后的图像大小，计算如下:

w n e w = ⌊ w + 2 * p - k s ⌋ + 1

h n e w = ⌊ h + 2 * p - k s ⌋ + 1

注：

inputn=channel, 卷积核深度等于输入特征层的深度
卷积后的特征层的深度等于outputn，及卷积核的个数

计算机在做卷积操作的时候，实际上，是转化为矩阵乘法操作，假设输入矩阵为X，卷积核为C，卷积后的矩阵为Y, 则

Y = C * X

例如：其中假设

X的大小为4x4, 卷积核大小为3x3, 没有padding和stride, 则输出为2x2的矩阵，其中

X可以展开为一个16维向量,

C可以写成稀疏矩阵，如下：

X = ⎛ ⎝ ⎜ ⎜ ⎜ x 00 x 10 x 20 x 30 x 01 x 11 x 21 x 31 x 02 x 12 x 22 x x 2 x 03 x 13 x 23 x 33 ⎞ ⎠ ⎟ ⎟ ⎟

转化为16维向量,

X = (x 00 x 01 x 02 x 03 x 10 x 11 x 12 x 13 x 20 x 21 x 22 x 23 x 30 x 31 x x 2 x 33)

卷积核

C，如下

C = ⎛ ⎝ ⎜ c 00 c 10 c 20 c 01 c 11 c 21 c 02 c 12 c 22 ⎞ ⎠ ⎟

转化成稀疏矩阵为：

C = ⎛ ⎝ ⎜ ⎜ ⎜ c 00 000 c 01 c 00 00 c 02 c 01 00 0 c 02 00 c 10 0 c 00 0 c 11 c 10 c 01 c 00 c 12 c 11 c 02 c 01 0 c 12 0 c 02 c 20 0 c 10 0 c 21 c 20 c 11 c 10 c 22 c 21 c 12 c 11 0 c 22 0 c 12 00 c 20 0 00 c 21 c 20 00 c 22 c 21 000 c 22 ⎞ ⎠ ⎟ ⎟ ⎟

从而，通过矩阵运算

C∗X可以生成一个4维向量，再转化为一个2x2的矩阵。

进一步，我们可以理解到，神经网络在做inference正向传播的时候，利用上述公式C∗X进行计算，在做反卷积时候，利用公式CT∗Y进行计算。

反卷积

这里写图片描述

假设输入特征层feature的大小为(w,h), 卷积核大小(k∗k), 步长为s, padding大小为p, 则通过反卷积后feature map的大小，计算公式如下：

w n e w = ⌊ w - 1 ⌋ * s + k - 2 p

h n e w = ⌊ h - 1 ⌋ * s + k - 2 p

例如，一张大小为5x5的图像, 经过(3x3)卷积核,
假设一：padding为1, stride为2，则经过卷积后图像的大小为

w = ⌊ 5 + 2 * 1 - 3 2 ⌋ + 1 = 3

h = ⌊ 5 + 2 * 1 - 3 2 ⌋ = 3

而，反卷积后的图像大小为

w n e w = ⌊ 3 - 1 ⌋ * 2 + 3 - 2 * 1 = 5

h n e w = ⌊ 3 - 1 ⌋ * 2 + 3 - 2 * 1 = 5

等于输入图像的大小。

假设二：stride为3，padding为1，则经过卷积后图像的大小为

w = ⌊ 5 + 2 * 1 - 3 3 ⌋ + 1 = 2

h = ⌊ 5 + 2 * 1 - 3 3 ⌋ + 1 = 2

而在经过反卷积后图像变为

w n e w = ⌊ 2 - 1 ⌋ * 3 + 3 - 2 * 1 = 4

h n e w = ⌊ 2 - 1 ⌋ * 3 + 3 - 2 * 1 = 4

假设三：stride为2， padding为2，则经过卷积后图像大小为：

w = ⌊ 5 + 2 * 2 - 3 2 ⌋ + 1 = 4

h = ⌊ 5 + 2 * 2 - 3 2 ⌋ + 1 = 4

而在经过反卷积后图像变为

w n e w = ⌊ 4 - 1 ⌋ * 2 + 3 - 2 * 2 = 5

h n e w = ⌊ 4 - 1 ⌋ * 2 + 3 - 2 * 2 = 5

假设四：stride为3，padding为2，则经过卷积后图像大小为：

w = ⌊ 5 + 2 * 2 - 3 3 ⌋ + 1 = 3

h = ⌊ 5 + 2 * 2 - 3 3 ⌋ + 1 = 3

而在经过反卷积后图像变为

w n e w = ⌊ 3 - 1 ⌋ * 3 + 3 - 2 * 2 = 5

h n e w = ⌊ 3 - 1 ⌋ * 3 + 3 - 2 * 2 = 5

注：当w+2∗p−ks不能整除的时候，反卷积得到的图像尺寸，会存在1个像素的差。

tensorflow中的卷积和反卷积操作

import numpy as npimport tensorflow as tfx1 = tf.constant(1.0, dtype=tf.float32, shape=[1,4,4,1])kernel = tf.constant(1.0, dtype=tf.float32, shape=[3,3,1,1])y1 = tf.nn.conv2d(x1, kernel, strides=[1,1,1,1], padding='SAME')y1_t = tf.nn.conv2d_transpose(y1, kernel, output_shape=[1,4,4,1], strides=[1,1,1,1], padding='SAME')sess = tf.Session()print('x1 = {}'.format(np.squeeze(sess.run(x1))))print('kernel = {}'.format(np.squeeze(sess.run(kernel))))print('y1 = {}'.format(np.squeeze(sess.run(y1))))print('y1_t = {}'.format(np.squeeze(sess.run(y1_t))))

输出结果为：x1 = [[ 1.  1.  1.  1.] [ 1.  1.  1.  1.] [ 1.  1.  1.  1.] [ 1.  1.  1.  1.]]kernel = [[ 1.  1.  1.] [ 1.  1.  1.] [ 1.  1.  1.]]y1 = [[ 4.  6.  6.  4.] [ 6.  9.  9.  6.] [ 6.  9.  9.  6.] [ 4.  6.  6.  4.]]y1_t = [[ 25.  40.  40.  25.] [ 40.  64.  64.  40.] [ 40.  64.  64.  40.] [ 25.  40.  40.  25.]]

阅读全文

1 0