程序博客网 > 凸优化理论

caffe中cifar10的full_train模型出现nan的解决办法

来源：互联网发布：凸优化理论编辑：程序博客网时间：2024/05/16 12:49

caffe在cifar10 的example上给出了两个模型，一个是quick模式，一个是full模式，训练full模式时会出现loss=nan的错误（当然不会报错，不过出现这个结果就是bug）

自己google了一下，在github上找到了原因跟解决方案，原来是作者把用在cuda-convnet的模型照搬过来了，在caffe上的模型应该去掉LRN层，所以解决的方法很简单：将网络结构中所有的归一化层全部去掉，并修改下一层的bottom参数，然后就不会出现loss=nan的错误了。
当然，如果自己做实验时出现loss=nan的问题时，我的一个解决办法是修改学习率，改的小一点就不会出现错误了。实在不行，就把里面的relu函数变为sigmoid试一试，代价就是训练速度会非常非常慢。

还有一个要检查的点就是要看一下网络的结构是否合理，我在网上下载的network in network的网络结构，最后一层竟然没有一层全连接把输出变为类别数，这让训练陷入了要么出现nan要么结果一直不变的bug境地。

0 0

凸优化理论

凸优化理论

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子无土栽培成本家庭蔬菜无土栽培技术室内无土种植蔬菜无土栽培莲藕无土栽培豆芽无土草坪一亩无土栽培蔬菜一年利润无土栽培架芽苗菜无土栽培技术菜心无土栽培技术萝卜苗无土栽培家庭无土栽培蔬菜设备无土泥鳅养殖技术大棚无土泥鳅养殖无土栽培设施无土养殖泥鳅无土栽培设备价格废土txt精校无错版无土养殖泥鳅技术立体无土栽培技术温室无土栽培技术无土蔬菜栽培家庭无土栽培蔬菜楼顶无土栽培香椿芽无土栽培技术无垠的太空第二季醉虎无垠浩瀚无垠的意思此心无垠全文免费阅读广阔无垠的意思仙本无垠苏懶辽阔无垠的近义词一望无垠的拼音无垠醉虎此心无垠txt下载无边无垠的意思浩瀚无垠的拼音无垠至无垢无垢上仙第章长孙无垢耸动