Xavier initialization
来源:互联网 发布:知之者不如好之者的者 编辑:程序博客网 时间:2024/06/16 02:52
Xavier初始化是什么鬼?
在Caffe中,每个卷积或全连接层的参数通过一个零均值与设定方差的正态分布进行初始化,其中方差的值为
这里需要提一下最开始在Glorot和Bengio的论文里他们是建议把方差设为
方差公式是怎么来的?
现在假设有一个n维输入向量X和一个单层线性神经网络,它的权重向量是W,X通过网络后的输出是Y。那么Y的方差是多少呢?很明显,
而Bengio在这个基础上考虑了反向传播时输入输出刚好反转,也就是要求
1. 对于神经网络而言,前向比反向的重要性更大;
2. 从实现上权衡,要得到对下一层网络的输入是很麻烦的。
MSRA初始化
最后顺便提一提微软的小明针对ReLU激活函数提出的一种初始化方法
这篇东西主要参考自这个博客,要是将来传播出了什么偏差,我是不会背锅的。
0 0
- Xavier initialization
- Xavier Initialization 的理解与推导(及实现)
- initialization
- Initialization
- Initialization
- initialization
- Initialization
- caffe filter type:Xavier
- xavier - 网络初始化问题
- “Xavier”初始化方法
- Caffe--xavier初始化方法
- Xavier初始化方法
- Xavier初始化方法
- caffe初始化-Xavier
- Xavier初始化方法
- direct initialization & copy initialization
- Sealing Classes in C++ ---- by Francis Xavier
- 深度学习——Xavier初始化方法
- oracle分区表详解
- android四大组件---Service
- JDK和JRE的区别是什么?
- mybatis实现关联表查询
- SpringMVC+Spring4+hibernate5使用java类配置spring和springmvc环境(不用配置web.xml)
- Xavier initialization
- 字节序
- leetcode:4. Median of Two Sorted Arrays
- Linux下通过SSH远程连接BAE
- 异常
- Android WebView Js 交互以及Js传参
- hdu 2049 错排问题 (简单)
- 使用dex2jar和jd-gui反编译apk得到Java源代码
- 浅析Linux开发工具之Makefile