基于Theano的深度学习(Deep Learning)框架Keras学习随笔-13-卷积层

来源:互联网 发布:淘宝商家信用卡费率 编辑:程序博客网 时间:2024/05/15 11:30

        本文来自CSDN博客:http://blog.csdn.net/niuwei22007/article/details/49366745

        上一篇介绍了基础核心层,就是用来构建普通网络的基础部件。这一篇主要介绍的是卷积层,主要用于构建卷积神经网络等需要用到卷积操作的神经网络。卷积操作(可以参看博文卷积算子计算方法-卷积操作)的优点就是可以增强原信号特征,增强对原信号位移、形变之后的识别能力,有效降低噪音等。而卷积神经网络是目前来说对图像识别的最好工具,因为它可以有效识别有位移、形变等的图像。下面来看下卷基层都有哪些结构。

一、Convolution1D

keras.layers.convolutional.Convolution1D(nb_filter,filter_length,        init='uniform', activation='linear', weights=None,        border_mode='valid', subsample_length=1,        W_regularizer=None, b_regularizer=None, W_constraint=None,        b_constraint=None, input_dim=None, input_length=None)

        该卷积操作用于过滤一维输入的相邻元素。当把该层作为模型的第一层时,要么给参数input_dim传值(int类型,比如128代表128维的向量),要么给input_shape传值(整数元组,比如(10,128)代表10个128维的向量)。

        inputshape: 3维 tensor(nb_samples, steps,input_dim)

        outputshape: 3维 tensor(nb_samples, steps,nb_filter) .steps的值可能会随着边缘填充0元素而产生变化。

        参数

  • nb_filter : 卷积核的数量,也是输出的一个维度。
  • filter_length : 每个过滤器的长度(因为是一维的,所以只有长度)。
  • init : 初始化权值的函数名称或Theano function。可以使用Keras内置的(内置初始化权值函数见这里),也可以传递自己编写的Theano function。如果不给weights传递参数时,则该参数必须指明。
  • activation : 激活函数名称或者Theano function。可以使用Keras内置的(内置激活函数见这里),也可以是传递自己编写的Theano function。如果不明确指定,那么将没有激活函数会被应用。
  • weights :用于初始化权值的numpy arrays组成的list。这个List至少有1个元素,其shape为input_dim, output_dim。(如果指定init了,那么weights可以赋值None)
  • border_mode: “valid”或”full”。valid模式只输出原图像经过卷积操作的结果;而full模式则是如果原图像与卷积核不匹配,有剩余时,通过填充0而凑整进行卷积运算。比如原图5*5,卷积算子2*2,依次匹配的话会有一列数据剩余。如果不计算剩余部分的数据就是valid模式;如果把原图通过填充0 的方式扩展为6*6的图像再计算,那就是full模式。官方简单解释看这里,也可以看我的博文卷积操作
  • subsample_length: factor by which to subsampleoutput。
  • W_regularizer:权值的规则化项,必须传入一个WeightRegularizer的实例(比如L1或L2规则化项,详细的内置规则化见这里)。
  • b_regularizer:偏置值的规则化项,必须传入一个WeightRegularizer的实例(比如L1或L2规则化项,详细的内置规则化见这里)。
  • activity_regularizer:网络输出的规则化项,必须传入一个ActivityRegularizer的实例(详细的内置规则化见这里)。
  • W_constraint:权值约束,必须传入一个constraints的实例(详细的约束限制见这里)。
  • b_constraint:偏置约束,必须传入一个constraints的实例(详细的约束限制见这里)。
  • input_dim:输入数据的维度。这个参数和input_shape至少要提供一个传值。
  • input_length:输入序列的长度。This argument is required ifyou are going to connectFlatten thenDense layers upstream (without it,the shape of the dense outputs cannot be computed)

二、Convolution2D

keras.layers.convolutional.Convolution2D(nb_filter,nb_row, nb_col,        init='glorot_uniform', activation='linear', weights=None,        border_mode='valid', subsample=(1, 1),        W_regularizer=None, b_regularizer=None, W_constraint=None)

        这个是CNN常用的方法。这个卷积操作是通过一个2维窗口的卷积核进行过滤。当把该层当做模型的第一层时,需要提供参数input_shape,比如input_shape=(3, 128, 128)表示128*128的RGB(3通道,看以理解成3张128*128的图片叠加而成的)图片。

        inputshape: 4维 tensor(nb_samples, channels,rows, cols)

        outputshape: 4维 tensor(nb_samples, nb_filter,rows, cols). rowscols的值可能会随着边缘填充0元素而产生变化。

        参数

  • nb_filter : 过滤器的数量。
  • nb_row : 卷积核的行数。
  • nb_col: 卷积核的列数。
  • init : 初始化权值的函数名称或Theano function。可以使用Keras内置的(内置初始化权值函数见这里),也可以传递自己编写的Theano function。如果不给weights传递参数时,则该参数必须指明。
  • activation : 激活函数名称或者Theano function。可以使用Keras内置的(内置激活函数见这里),也可以是传递自己编写的Theano function。如果不明确指定,那么将没有激活函数会被应用。
  • weights :用于初始化权值的numpy arrays组成的list。这个List至少有1个元素,其shape为input_dim, output_dim。(如果指定init了,那么weights可以赋值None)
  • border_mode: “valid”或”full”。valid模式只输出原图像经过卷积操作的结果;而full模式则是如果原图像与卷积核不匹配,有剩余时,通过填充0而凑整进行卷积运算。比如原图5*5,卷积算子2*2,依次匹配的话会有一列数据剩余。如果不计算剩余部分的数据就是valid模式;如果把原图通过填充0 的方式扩展为6*6的图像再计算,那就是full模式。官方简单解释看这里,也可以看我的博文卷积操作
  • subsample_length: factor by which to subsampleoutput。
  • W_regularizer:权值的规则化项,必须传入一个WeightRegularizer的实例(比如L1或L2规则化项,详细的内置规则化见这里)。
  • b_regularizer:偏置值的规则化项,必须传入一个WeightRegularizer的实例(比如L1或L2规则化项,详细的内置规则化见这里)。
  • activity_regularizer:网络输出的规则化项,必须传入一个ActivityRegularizer的实例(详细的内置规则化见这里)。
  • W_constraint:权值约束,必须传入一个constraints的实例(详细的约束限制见这里)。
  • b_constraint:偏置约束,必须传入一个constraints的实例(详细的约束限制见这里)。 

三、MaxPooling1D

layers.convolutional.MaxPooling1D(pool_length=2, stride=None, ignore_border=True)

        最大池化操作,也就是常说的下采样。因为这个是对于1维输入进行操作的,因此下采样因子就只有一个长度。

        inputshape: 3维 tensor(nb_samples, steps, dim)

        outputshape: 3维 tensor(nb_samples,downsampled_steps, dim)

        参数

  • pool_length : 下采样因子的长度。比如对输入进行length=2的下采样操作的话,结果就剩下了输入的一半。
  • stride: int或者None。
  • ignore_border: boolean,是否忽略掉边缘部分数据。

四、MaxPooling2D

keras.layers.convolutional.MaxPooling2D(pool_size=(2, 2), ignore_border=True)

        这个下采样的采样因子是2维的。

        inputshape: 4维 tensor(nb_samples, stack_size,nb_row, nb_col)

        outputshape: 4维 tensor(nb_samples, stack_size,new_nb_row, new_nb_col)

        参数

  • pool_size : 下采样因子的shape。比如对输入进行size为(2,2)的下采样操作的话,结果就剩下了输入的每一维度的一半,即总的结果是原输入的四分之一。
  • ignore_border: boolean。比如原输入是(5,5),pool_size=(2,2),如果ignore_border=True的话,那么生成的结果将会是(2,2);如果ignore_border=False时,生成的结果将会是(3,3)。 

参考资料:

  •  官方教程

0 0