Caffe 深度学习框架上手教程
来源:互联网 发布:消防海湾主机编程实例 编辑:程序博客网 时间:2024/04/29 19:23
Caffe是一个清晰而高效的深度学习框架,本文详细介绍了caffe的优势、架构,网络定义、各层定义,Caffe的安装与配置,解读了Caffe实现的图像分类模型AlexNet,并演示了CIFAR-10在caffe上进行训练与学习。
Caffe是一个清晰而高效的深度学习框架,其作者是博士毕业于UC Berkeley的 贾扬清,目前在Google工作。
Caffe是纯粹的C++/CUDA架构,支持命令行、Python和MATLAB接口;可以在CPU和GPU直接无缝切换:
Caffe的优势
1. 上手快:模型与相应优化都是以文本形式而非代码形式给出。
Caffe给出了模型的定义、最优化设置以及预训练的权重,方便立即上手。
2. 速度快:能够运行最棒的模型与海量的数据。
Caffe与cuDNN结合使用,测试AlexNet模型,在K40上处理每张图片只需要1.17ms.
3. 模块化:方便扩展到新的任务和设置上。
可以使用Caffe提供的各层类型来定义自己的模型。
4. 开放性:公开的代码和参考模型用于再现。
社区好:可以通过BSD-2参与开发与讨论。
Caffe的网络定义
Caffe中的网络都是有向无环图的集合,可以直接定义:
name: "dummy-net"layers {<span><span>name: <span>"data" …</span></span></span>}layers {<span><span>name: <span>"conv" …</span></span></span>}layers {<span><span>name: <span>"pool" …</span></span></span>}layers {<span><span>name: <span>"loss" …</span></span></span>}
Caffe的各层定义
Caffe层的定义由2部分组成:层属性与层参数,例如name:"conv1"type:CONVOLUTIONbottom:"data"top:"conv1"convolution_param{ num_output:<span>20 kernel_size:5 stride:1 weight_filler{ type: "<span style="color: #c0504d;">xavier</span>" }}
这段配置文件的前4行是层属性,定义了层名称、层类型以及层连接结构(输入blob和输出blob);而后半部分是各种层参数。
Blob
Blob是用以存储数据的4维数组,例如
- 对于数据:Number*Channel*Height*Width
- 对于卷积权重:Output*Input*Height*Width
- 对于卷积偏置:Output*1*1*1
训练网络
网络参数的定义也非常方便,可以随意设置相应参数。
甚至调用GPU运算只需要写一句话
CIFAR-10在caffe上进行训练与学习
使用数据库:CIFAR-10
60000张 32X32 彩色图像 10类,50000张训练,10000张测试
准备
在终端运行以下指令:
cd $CAFFE_ROOT/data/cifar10./get_cifar10.shcd $CAFFE_ROOT/examples/cifar10./create_cifar10.sh
其中CAFFE_ROOT是caffe-master在你机子的地址
运行之后,将会在examples中出现数据库文件./cifar10-leveldb和数据库图像均值二进制文件./mean.binaryproto
模型
该CNN由卷积层,POOLing层,非线性变换层,在顶端的局部对比归一化线性分类器组成。该模型的定义在CAFFE_ROOT/examples/cifar10 directory’s cifar10_quick_train.prototxt中,可以进行修改。其实后缀为prototxt很多都是用来修改配置的。
训练和测试
训练这个模型非常简单,当我们写好参数设置的文件cifar10_quick_solver.prototxt和定义的文 件cifar10_quick_train.prototxt和cifar10_quick_test.prototxt后,运行 train_quick.sh或者在终端输入下面的命令:
cd $CAFFE_ROOT/examples/cifar10./train_quick.sh
即可,train_quick.sh是一个简单的脚本,会把执行的信息显示出来,培训的工具是train_net.bin,cifar10_quick_solver.prototxt作为参数。
然后出现类似以下的信息:这是搭建模型的相关信息
I0317 21:52:48.945710 2008298256 net.cpp:74] Creating Layer conv1I0317 21:52:48.945716 2008298256 net.cpp:84] conv1 <- dataI0317 21:52:48.945725 2008298256 net.cpp:110] conv1 -> conv1I0317 21:52:49.298691 2008298256 net.cpp:125] Top shape: 100 32 32 32 (3276800)I0317 21:52:49.298719 2008298256 net.cpp:151] conv1 needs backward computation.接着:
0317 21:52:49.309370 2008298256 net.cpp:166] Network initialization done.I0317 21:52:49.309376 2008298256 net.cpp:167] Memory required for Data 23790808I0317 21:52:49.309422 2008298256 solver.cpp:36] Solver scaffolding done.I0317 21:52:49.309447 2008298256 solver.cpp:47] Solving CIFAR10_quick_train之后,训练开始
I0317 21:53:12.179772 2008298256 solver.cpp:208] Iteration 100, lr = 0.001I0317 21:53:12.185698 2008298256 solver.cpp:65] Iteration 100, loss = 1.73643...I0317 21:54:41.150030 2008298256 solver.cpp:87] Iteration 500, Testing netI0317 21:54:47.129461 2008298256 solver.cpp:114] Test score #0: 0.5504I0317 21:54:47.129500 2008298256 solver.cpp:114] Test score #1: 1.27805
其中每100次迭代次数显示一次训练时lr(learningrate),和loss(训练损失函数),每500次测试一次,输出score 0(准确率)和score 1(测试损失函数)
当5000次迭代之后,正确率约为75%,模型的参数存储在二进制protobuf格式在cifar10_quick_iter_5000
然后,这个模型就可以用来运行在新数据上了。
- Caffe 深度学习框架上手教程
- Caffe 深度学习框架上手教程
- Caffe 深度学习框架上手教程
- Caffe 深度学习框架上手教程
- Caffe 深度学习框架上手教程
- Caffe 深度学习框架上手教程
- Caffe 深度学习框架上手教程
- Caffe 深度学习框架上手教程
- Caffe 深度学习框架上手教程
- Caffe 深度学习框架上手教程
- Caffe 深度学习框架上手教程
- Caffe 深度学习框架上手教程
- Caffe 深度学习框架上手教程
- caffe 深度学习框架上手教程
- Caffe 深度学习框架上手教程
- Caffe深度学习框架上手教程
- Caffe 深度学习框架上手教程
- Caffe 深度学习框架上手教程
- 辗转相除法---切蛋糕
- Android学习笔记 - TabHost 和 Menu(一)
- 为何使用动态代理
- [Leetcode]Letter Combinations of a Phone Number
- su & sudo
- Caffe 深度学习框架上手教程
- Linux flash 文件系统剖析
- ym——Android仿网易新闻导航栏PagerSlidingTabStrip源码分析
- C字符串输入输出
- 绘制SVG内容到Canvas的HTML5应用
- urllib2模块之异常处理
- [BestCoder] Round #4
- python 之 os
- __asm__ __volatile__("": : :"memory")