【TensorFlow】tf.nn.max_pool实现池化操作

来源:互联网 发布:防复制软件 编辑:程序博客网 时间:2024/06/06 14:20

max pooling是CNN当中的最大值池化操作,其实用法和卷积很类似

有些地方可以从卷积去参考【TensorFlow】tf.nn.conv2d是怎样实现卷积的? 

tf.nn.max_pool(value, ksize, strides, padding, name=None)

参数是四个,和卷积很类似:

第一个参数value:需要池化的输入,一般池化层接在卷积层后面,所以输入通常是feature map,依然是[batch, height, width, channels]这样的shape

第二个参数ksize:池化窗口的大小,取一个四维向量,一般是[1, height, width, 1],因为我们不想在batch和channels上做池化,所以这两个维度设为了1

第三个参数strides:和卷积类似,窗口在每一个维度上滑动的步长,一般也是[1, stride,stride, 1]

第四个参数padding:和卷积类似,可以取'VALID' 或者'SAME'

返回一个Tensor,类型不变,shape仍然是[batch, height, width, channels]这种形式


示例源码:

假设有这样一张图,双通道

第一个通道:

第二个通道:

用程序去做最大值池化:

import tensorflow as tfa=tf.constant([        [[1.0,2.0,3.0,4.0],        [5.0,6.0,7.0,8.0],        [8.0,7.0,6.0,5.0],        [4.0,3.0,2.0,1.0]],        [[4.0,3.0,2.0,1.0],         [8.0,7.0,6.0,5.0],         [1.0,2.0,3.0,4.0],         [5.0,6.0,7.0,8.0]]    ])a=tf.reshape(a,[1,4,4,2])pooling=tf.nn.max_pool(a,[1,2,2,1],[1,1,1,1],padding='VALID')with tf.Session() as sess:    print("image:")    image=sess.run(a)    print (image)    print("reslut:")    result=sess.run(pooling)    print (result)
这里步长为1,窗口大小2×2,输出结果:

image:[[[[ 1.  2.]   [ 3.  4.]   [ 5.  6.]   [ 7.  8.]]  [[ 8.  7.]   [ 6.  5.]   [ 4.  3.]   [ 2.  1.]]  [[ 4.  3.]   [ 2.  1.]   [ 8.  7.]   [ 6.  5.]]  [[ 1.  2.]   [ 3.  4.]   [ 5.  6.]   [ 7.  8.]]]]reslut:[[[[ 8.  7.]   [ 6.  6.]   [ 7.  8.]]  [[ 8.  7.]   [ 8.  7.]   [ 8.  7.]]  [[ 4.  4.]   [ 8.  7.]   [ 8.  8.]]]]
池化后的图就是:

证明了程序的结果是正确的。


我们还可以改变步长

pooling=tf.nn.max_pool(a,[1,2,2,1],[1,2,2,1],padding='VALID')
最后的result就变成:

reslut:[[[[ 8.  7.]   [ 7.  8.]]  [[ 4.  4.]   [ 8.  8.]]]]


5 0