如何有效阅读caffe源码

来源:互联网 发布:淘宝下架时间显示插件 编辑:程序博客网 时间:2024/04/28 10:22

 Caffee是用C++编写的深度学习框架,大量使用类的封装,继承,多态,所以也可以用来学习C++语言特性。Caffe类数目众多,但通过面向对象编程(OOP)方式组织得很好,所以要遵循类继承规则顺藤摸瓜,就会看得云里雾里,迷失丛林。
如何有效阅读caffe源码?
 Caffe源码阅读路线最好是从src/caffe/proto/caffe.proto开始,了解基本的数据结构、内存对象和磁盘文件的一一映射关系(如何从磁盘文件加载一个数据结构到内存对象,以及如何将内存对象保存为磁盘文件,这中间的过程其实都是有ProtoBuffer工具自动完成的)。
 第二步是看头文件。不用急于看cpp文件,先通过头文件类声明理解整个框架,发挥想象力“猜”具体实现,从基类向派生类顺藤摸瓜看下去,很容易掌握这些类的使用方法。
 第三步就是有针对性地去看cpp和cu文件了。一般而言,Caffe框架并不需要大改,按需求派生新的类即可。例如,你使用了新的卷计算法,需要自己实现相应的ConvolutionLayer,则只需要从已有的ConvolutionLayer派生一个心累MyConvolutionLayer,然后将前向传播计算,反向传播计算按自己的算法实现即可。这一阶段关注点在算法上,相应的测试和正确性验证手段是必须的。
 第四步就很自由了,可以编写各类工具,集成到Caffe内部。在tools/下面已经有很多实用工具(如训练模型,测试模型,特征提取,转换数据格式等),可以根据需要修改。另外,也可以学习用Python或Matlab包装Caffe的方法,便于调节模型训练效果。

2 1
原创粉丝点击