FCN-for-semantic-image-segmentation 训练过程的一些坑记录

来源:互联网 发布:java获取response对象 编辑:程序博客网 时间:2024/04/29 04:37

(1)首先,出现layer registry error,提示convolutional layer已经注册过了。网上大多的问题是提示unknown layer,并非already registed,大概有两种针对前一种的解决方法:1.链接的caffe静态库和动态库的区别,应该链接动态库?2.caffe的注册机制的问题,添加头文件,外部强制注册?感觉不太像是我这个问题的答案。查了谷歌,好像是我装了两个版本的caffe导致caffe的路径并未完全设置成其中某个版本的。于是修改.bashrc中所有和caffe有关的路径,修改完后并没有用。但是第二天重新开始训的时候,神奇的可以了。。。。神奇的可以了。。。

(2)第二,训练了几万循环,发现loss一直没有变化。查了查,据说是反卷积层没有初始化weight,查看了代码,代码中有python接口的训练和command line接口的训练,其中我用的一直是command line接口的(就是--solver=。。。。sh train.sh)这个接口没有初始化weight。于是在net.py中deconvolutional layer加入了weight filler 和 bias filler参数(net.py是网络结构的生成文件,修改了以后要执行一下python net.py)。而另一个python接口的代码,已经初始化了合适的weight,用的是VGG16训出来的caffemodel,然而没有成功运行python 接口。于是先自己把command line接口里的weight,初始化了一个高斯随机生成,先跑跑看。

(3)果不其然,loss逐渐减小,但是随着训练次数的增加,其收敛性不是很好,几乎一直处在震荡状态,从3.x左右降到1.x,之后便震荡起来。考虑到没有按照作者的要求初始化合适的weight,也许原因在此,因此还是要继续试试python接口。

0 0
原创粉丝点击