caffe 训练之学习率
来源:互联网 发布:单片机射频通讯 编辑:程序博客网 时间:2024/04/29 13:34
今天,自己在用caffe训练alfw的pose数据集时,使用欧几里得loss回归,发现测试的每张图片经过训练的网络,得到的回归值几乎全都一样。刚开始以为数据错了,于是在caffe的data_layer层中将读入的值打印出来,发现没问题;继续将欧几里得loss层的两个bottom输入的值也打印出来,发现在经过几千次迭代后,验证集的预测值几乎都一样,一点点查原因。网络结构、数据都没问题,但是这个现象说明网络根本就没怎么学习,于是看了solver.protxt里面的几个参数,学习率设为0.0001,太小,改成0.01重新训练,刚才的现象没了,而且loss下降的也很快。通过这次,自己也总结了一下caffe训练时,一开始可以把学习率适当调高些,取0.01时比较合适,然后看训练和测试的loss,如果收敛了而且有继续下降的趋势,可以降低学习率继续训,这样模型比一开始就把学习率设那么小效果要好得多。
0 0
- caffe 训练之学习率
- Caffe学习之训练mnist
- caffe学习之训练与测试minst
- caffe学习笔记之Caffe for Windows 训练cifar10
- caffe之训练数据格式
- caffe之训练数据格式
- caffe之训练数据格式
- 深度学习(十三)caffe之训练数据格式
- 深度学习(十三)caffe之训练数据格式
- CAFFE学习笔记(一)Caffe_Example之训练mnist
- 深度学习(十三)caffe之训练数据格式
- CAFFE学习笔记(一)Caffe_Example之训练mnist
- 深度学习(十三)caffe之训练数据格式
- 深度学习(十三)caffe之训练数据格式
- caffe学习之二----mnist集合训练及其测试
- 迁移学习之caffe训练的层设置
- caffe学习(3)------caffe训练日志
- <caffe学习笔记> caffe训练日志输出
- 字符串函数
- 内存泄露问题总结--static修饰的静态View
- Google Gson 基本用法
- java动态代理实现步骤解析
- 关于java中返回ResultSet结果集行数
- caffe 训练之学习率
- 单点登录SSO的实现原理
- 一天练习一个小C/C++程序(二) 指针到底该如何使用
- SpringBoot配置多套环境
- Leetcode177. Nth Highest Salary(SQL语句中使用函数)
- jquery返回顶部简单特效
- Activiti监听器(十一)
- Struts2中的ModelDriven机制及其运用
- LeetCode 104Maximum Depth of Binary Tree(DFS?)