keras中文文档笔记6——使用陷阱
来源:互联网 发布:淘宝网店项目策划书 编辑:程序博客网 时间:2024/06/05 05:30
TF卷积核与TH卷积核
Keras提供了两套后端,Theano和Tensorflow,所以如果你想使用一个已有网络,或把一个用th/tf 训练的网络以另一种后端应用,在载入的时候你就应该特别小心了。
卷积核与所使用的后端不匹配,不会报任何错误,因为它们的shape是完全一致的,没有方法能够检测出这种错误。
在使用预训练模型时,一个建议是首先找一些测试样本,看看模型的表现是否与预计的一致。
如需对卷积核进行转换,可以使用utils.convert_all_kernels_in_model对模型的所有卷积核进行转换。
向BN层中载入权重
如果你不知道从哪里淘来一个预训练好的BN层,想把它的权重载入到Keras中,要小心参数的载入顺序。
一个典型的例子是,将caffe的BN层参数载入Keras中,caffe的BN由两部分构成,bn层的参数是mean,std,scale层的参数是gamma,beta。
按照BN的文章顺序,似乎载入Keras BN层的参数应该是[mean, std, gamma, beta]
然而不是,Keras的BN层参数顺序应该是[gamma, beta, mean, std],这是因为gamma和beta是可训练的参数,而mean和std不是。
Keras的可训练参数在前,不可训练参数在后。
错误的权重顺序不会引起任何报错,因为它们的shape完全相同。
shuffle和validation_split的顺序
模型的fit函数有两个参数,shuffle用于将数据打乱,validation_split用于在没有提供验证集的时候,按一定比例从训练集中取出一部分作为验证集。
这里有个陷阱是,程序是先执行validation_split,再执行shuffle的,所以会出现这种情况:
假如你的训练集是有序的,比方说正样本在前负样本在后,又设置了validation_split,那么你的验证集中很可能将全部是负样本
同样的,这个东西不会有任何错误报出来,因为Keras不可能知道你的数据有没有经过shuffle,保险起见如果你的数据是没shuffle过的,最好手动shuffle一下
Merge层的层对象与函数方法
Keras定义了一套用于融合张量的方法,位于keras.layers.Merge,里面有两套工具:
以大写字母开头的是Keras Layer类,使用这种工具是需要实例化一个Layer对象,然后再使用;
以小写字母开头的是张量函数方法,本质上是对Merge Layer对象的一个包装,但使用更加方便一些。注意辨析。
- keras中文文档笔记6——使用陷阱
- keras中文文档笔记12——协助使用Keras
- keras中文文档笔记9——关于keras层
- keras中文文档笔记16——使用预训练的词向量
- keras中文文档笔记1——概述
- keras中文文档笔记2——一些基本概念
- keras中文文档笔记3——常见问题与解答
- keras中文文档笔记4——配置与安装
- keras中文文档笔记5——快速开始
- keras中文文档笔记7——序贯模型
- keras中文文档笔记8——函数式模型
- keras中文文档笔记10——数据预处理
- keras中文文档笔记11——网络配置
- keras中文文档笔记14——花式自动编码器
- keras中文文档笔记17——将Keras作为tensorflow的精简接口
- keras中文文档笔记13——解释CNN的滤波器
- keras中文文档笔记15——面向小数据集构建图像分类模型
- Keras中文文档
- 判断回文数的简便算法
- 使用Gson解析报错
- Android开源框架greenDAO 3.X的使用
- Codeforces Round #429 (Div. 2):A. Generous Kefa
- Python函数
- keras中文文档笔记6——使用陷阱
- Maven学习总结(一)——Maven入门
- Codeforces Round #429 (Div. 2):B. Godsend
- web-servlet-tomcat原生部署
- u3d物体包含之后的坐标计算
- 杂记
- 编程题——和为sum的方法数
- 有用的位运算
- TCP/IP入门