CS231n学习笔记--5.CNN&&6-7. Training Neural Networks
来源:互联网 发布:网络歌手萧风 编辑:程序博客网 时间:2024/06/05 12:16
1.CNN
1.1 原理
Tips:
1.每个卷积层由K个卷积模板生成,例如:第一层一般为边缘检测的卷积模板。
2.为了使卷积前后的数据维度一致,可以将原始数据进行边拓展,拓展的数量为P。
1.2.CNN流程
Tips:
1.每个卷积层后会有Relu操作,起将矩阵稀疏化的作用。
2.若干个卷积层后会有POOL操作,其实就是降采样,一般取采样区域中的最大值为采样结果。
3.最后是FC(full connected)layers(第三章所讲的神经网络),对数据进行分类识别,计算样本在各分类下的分值,最后使用softmax激活函数。
2. Training Neural Networks 1
2.1 Activation Functions
Sigmoid激活函数的导数大于0,如果输入数据全是正或全是负,那么dL/dw符号始终不变,这意味着w的更新方向均相同,这必然对寻找合适的w参数不利,这也是为什么一般要求数据关于0对称的原因,也解释了问题2。
ReLU的改进:
总结与建议:
2.2 Date Preprocessing
Whitening的目的是去掉数据之间的相关联度,是很多算法进行预处理的步骤。比如说当训练图片数据时,由于图片中相邻像素值有一定的关联,所以很多信息是冗余的。这时候去相关的操作就可以采用白化操作。数据的whitening必须满足两个条件:一是不同特征间相关性最小,接近0;二是所有特征的方差相等(不一定为1)。常见的白化操作有PCA whitening和ZCA whitening。
PCA whitening是指将数据x经过PCA降维为z后,可以看出z中每一维是独立的,满足whitening白化的第一个条件,这是只需要将z中的每一维都除以标准差就得到了每一维的方差为1,也就是说方差相等。公式为:
ZCA whitening是指数据x先经过PCA变换为z,但是并不降维,因为这里是把所有的成分都选进去了。这是也同样满足whtienning的第一个条件,特征间相互独立。然后同样进行方差为1的操作,最后将得到的矩阵左乘一个特征向量矩阵U即可。
ZCA whitening公式为:
2.3 Weight Initialiation
2.4 Bath Normalization
2.5 Baby Setting the Learning Process
2.6 Hyperparameter Optimzation
3. Training Neural Networks 2
3.1 Fancier optimization
3.2 Regularization
3.2.2 训练数据增强
3.3 Transfer Learning
- CS231n学习笔记--5.CNN&&6-7. Training Neural Networks
- CS231N-6&7-Training Neural Networks
- CS231n学习笔记--10.Recurrent Neural Networks
- 【CS231n笔记】06 Training Neural Networks, Part 2
- 【CS231n】Lecture 6:Training Neural Networks,Part 2
- CS231n学习笔记--4.Backpropagation and Neural Networks
- 【CS231n笔记】07 Convolutional Neural Networks
- 【CS231n winter2016 Lecture 6 (Training Neural Networks Part 3,update schemes/dropout and so on..)】
- CS231n系列课程Lecture6: Training Neural Networks, Part 2
- CS231N-4-Neural Networks
- Neural Networks学习笔记
- (Convolutional Neural Networks)CNN-卷积神经网络学习
- CNN(Convolutional Neural Networks)学习总结
- CS231N-5-Convolutional Neural Networks
- CS231N-Lecture5 Training Neural Network
- 20170307#cs231n#7.Neural Networks Part 3: Learning and Evaluation
- CS231n学习笔记--9.CNN Architectures
- 《Understanding the difficulty of training deep feedforward neural networks》笔记
- android studio环境安装过程
- 浏览器下载二维码压缩文件(支持中文文件名)
- Unity框架设计(一) 消息处理框架
- 全局、局部、静态变量与堆栈内存区
- hdoj1029(基础DP)
- CS231n学习笔记--5.CNN&&6-7. Training Neural Networks
- RN学习:如何删除node_modules文件夹?
- iOS 获取AppStore 中应用的下载地址
- c++ Eigen 入门学习
- 基于CentOS 7 web服务环境搭建(包含JDK+Nginx+Tomcat+Mysql+Redis)
- 树的子结构java实现
- Java学习日记1——基本数据类型和运算符还有数组
- echarts之随机方块
- 在CentOS6.7搭建Qt5.6.2环境