Caffe 深度学习框架上手教程

来源:互联网 发布:消防海湾主机编程实例 编辑:程序博客网 时间:2024/04/29 19:23

Caffe是一个清晰而高效的深度学习框架,本文详细介绍了caffe的优势、架构,网络定义、各层定义,Caffe的安装与配置,解读了Caffe实现的图像分类模型AlexNet,并演示了CIFAR-10在caffe上进行训练与学习。

Caffe是一个清晰而高效的深度学习框架,其作者是博士毕业于UC Berkeley的 贾扬清,目前在Google工作。
Caffe是纯粹的C++/CUDA架构,支持命令行、Python和MATLAB接口;可以在CPU和GPU直接无缝切换:

Caffe的优势
1. 上手快:模型与相应优化都是以文本形式而非代码形式给出。 
     Caffe给出了模型的定义、最优化设置以及预训练的权重,方便立即上手。
2. 速度快:能够运行最棒的模型与海量的数据。 
     Caffe与cuDNN结合使用,测试AlexNet模型,在K40上处理每张图片只需要1.17ms.
3. 模块化:方便扩展到新的任务和设置上。 
     可以使用Caffe提供的各层类型来定义自己的模型。
4. 开放性:公开的代码和参考模型用于再现。
     社区好:可以通过BSD-2参与开发与讨论。


Caffe的网络定义

Caffe中的网络都是有向无环图的集合,可以直接定义: 

name: "dummy-net"layers {<span><span>name: <span>"data" …</span></span></span>}layers {<span><span>name: <span>"conv" …</span></span></span>}layers {<span><span>name: <span>"pool" …</span></span></span>}layers {<span><span>name: <span>"loss" …</span></span></span>}


Caffe的各层定义

Caffe层的定义由2部分组成:层属性与层参数,例如

name:"conv1"type:CONVOLUTIONbottom:"data"top:"conv1"convolution_param{    num_output:<span>20    kernel_size:5    stride:1    weight_filler{        type: "<span style="color: #c0504d;">xavier</span>"    }}

这段配置文件的前4行是层属性,定义了层名称、层类型以及层连接结构(输入blob和输出blob);而后半部分是各种层参数。 

Blob

Blob是用以存储数据的4维数组,例如

  • 对于数据:Number*Channel*Height*Width
  • 对于卷积权重:Output*Input*Height*Width
  • 对于卷积偏置:Output*1*1*1

训练网络


网络参数的定义也非常方便,可以随意设置相应参数。

甚至调用GPU运算只需要写一句话


CIFAR-10在caffe上进行训练与学习

使用数据库:CIFAR-10

60000张 32X32 彩色图像 10类,50000张训练,10000张测试



准备

在终端运行以下指令:

cd $CAFFE_ROOT/data/cifar10./get_cifar10.shcd $CAFFE_ROOT/examples/cifar10./create_cifar10.sh

其中CAFFE_ROOT是caffe-master在你机子的地址

运行之后,将会在examples中出现数据库文件./cifar10-leveldb和数据库图像均值二进制文件./mean.binaryproto

模型

该CNN由卷积层,POOLing层,非线性变换层,在顶端的局部对比归一化线性分类器组成。该模型的定义在CAFFE_ROOT/examples/cifar10 directory’s cifar10_quick_train.prototxt中,可以进行修改。其实后缀为prototxt很多都是用来修改配置的。

训练和测试

训练这个模型非常简单,当我们写好参数设置的文件cifar10_quick_solver.prototxt和定义的文 件cifar10_quick_train.prototxt和cifar10_quick_test.prototxt后,运行 train_quick.sh或者在终端输入下面的命令:

cd $CAFFE_ROOT/examples/cifar10./train_quick.sh

即可,train_quick.sh是一个简单的脚本,会把执行的信息显示出来,培训的工具是train_net.bin,cifar10_quick_solver.prototxt作为参数。

然后出现类似以下的信息:这是搭建模型的相关信息

?

I0317 21:52:48.945710 2008298256 net.cpp:74] Creating Layer conv1I0317 21:52:48.945716 2008298256 net.cpp:84] conv1 <- dataI0317 21:52:48.945725 2008298256 net.cpp:110] conv1 -> conv1I0317 21:52:49.298691 2008298256 net.cpp:125] Top shape: 100 32 32 32 (3276800)I0317 21:52:49.298719 2008298256 net.cpp:151] conv1 needs backward computation.
接着:

0317 21:52:49.309370 2008298256 net.cpp:166] Network initialization done.I0317 21:52:49.309376 2008298256 net.cpp:167] Memory required for Data 23790808I0317 21:52:49.309422 2008298256 solver.cpp:36] Solver scaffolding done.I0317 21:52:49.309447 2008298256 solver.cpp:47] Solving CIFAR10_quick_train
之后,训练开始

I0317 21:53:12.179772 2008298256 solver.cpp:208] Iteration 100, lr = 0.001I0317 21:53:12.185698 2008298256 solver.cpp:65] Iteration 100, loss = 1.73643...I0317 21:54:41.150030 2008298256 solver.cpp:87] Iteration 500, Testing netI0317 21:54:47.129461 2008298256 solver.cpp:114] Test score #0: 0.5504I0317 21:54:47.129500 2008298256 solver.cpp:114] Test score #1: 1.27805

其中每100次迭代次数显示一次训练时lr(learningrate),和loss(训练损失函数),每500次测试一次,输出score 0(准确率)和score 1(测试损失函数)

当5000次迭代之后,正确率约为75%,模型的参数存储在二进制protobuf格式在cifar10_quick_iter_5000

然后,这个模型就可以用来运行在新数据上了。









0 0
原创粉丝点击