程序博客网 > flash cs5 mac中文版

深度神经网络调参经验

来源：互联网发布：flash cs5 mac中文版编辑：程序博客网时间：2024/05/23 18:25

σ′(⋅)=σ(⋅)(1−σ(⋅))，tanh′=1−tanh2
batch_size：将数据集划分为不同的 batch，是为了限制 RAM 的使用，防止内存溢出；
- batch_size = 256;
ℓ 层的神经网络，对于着 ℓ−1 个层间权值矩阵；

0. 简单参数

hyperparameters：
- learning rate：一般从 0.01 开始设起，变化的幅度为 10 倍；

1. 激活函数：做非线性映射

Sigmoid 和 tanh 激活函数的问题在于，在函数的最左侧和最右侧，斜率为 0；
- 这样当 BP 时，复合函数的求导（连乘） ==> 导致梯度消失；
- ReLU 收敛的速度要比 tanh 的速度快 6 倍，其收敛速度足够快；
CNN 尽量不要用 sigmoid（RNN 会用到 Sigmoid 和 tanh）
- 首先试 ReLU，因为快，但需要小心；
- 如果 ReLU 失效，使用 Leaky ReLU 或者 Maxout
当然神经网络的输出层一般还是 Sigmoid 函数，因为其值接近于概率输出分布；

2. 池化层的选择

池化层（Pooling Layer），downsampling，压缩数据和参数的量，减少过拟合；

图像识别一般使用 maxpooling
neural style 使用 average pooling

3. 深度模型的结构

CNN
- Input
- [ [CONV -> ReLU]*N -> Pool ?]*M
  - ? 表示可能会接池化层
- [FC -> ReLU] * K
- FC

4. 从框架的角度

caffe：
- 每一层都可以定义 learning rate，因此可以分段调整学习率（learning rate）

0 0

flash cs5 mac中文版

flash cs5 mac中文版

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子唇纸纹唇线唇线唇线笔嘴唇很痒唇线边缘也痒怎么用线去唇毛唇线怎么纹粉色唇线笔唇线笔哪个牌子好漂唇有唇线吗唇线是什么唇线笔怎么用唇线图片唇线笔的作用唇线笔可以当口红用吗唇线怎么画鼻唇沟吸脂唇部抽脂唇部吸脂香奈儿唇膏润唇膏牌子唇膏保质期凡士林唇膏迪奥唇膏唇膏男自制唇膏小蓝罐唇膏 999唇膏孕妇唇膏唇膏可以吃小蓝瓶唇膏红樱桃唇膏孕妇用唇膏好用唇膏粉红色唇膏美宝莲唇膏圣罗兰唇膏唇膏图片唇膏的作用滋润的唇膏女士润唇膏