DeepLearing学习笔记-改善深层神经网络(第三周- 超参数调试、正则化)
来源:互联网 发布:java泛型坑 编辑:程序博客网 时间:2024/05/29 13:22
背景:
介绍超参数调试和处理
1-超参数调试
相比于早期那种参数较少的情况,可以用网格状的数值划分来做数值的遍历,来获取最优参数。但是在深度学习领域,我们一般是采用随机化的方式进行参数的尝试。
如上图的网格状选取参数其实只能分别在固定在5个值范围内,在我们尚未知晓哪个参数更为重要的前提下是不明智的。此时,我们如果采用右图的随机取值方式,在取值都是25个的情况下,我们获取的是25个的参数1和25个的参数2。比如其中一个参数是学习率
对于多更多的超参数,其参数的搜索空间是高纬度的,同理也是采用随机取值的方式,进而提高搜索效率。
另外一种方式是先粗糙再精细的搜索方式。在上述的随机取值后,我们会发现某些区域的取值效果更好,那么我们在这个区域进行细化取值,更加密集地取值。
2-选择合适范围的超参数
之前说的随机取值,并不是在有效值范围内的随机均匀取值,而是选择合适的标尺之后的均匀取值。
对于神经网络中某层中的神经元个数,我们可以在一定范围内,比如20~40进行均匀搜索;再或者对于神经网络的层数,我们同样可以在一定范围内,如2~5内进行均匀搜索。但是对于有些参数则不适用。
比如学习率
Python实现:
r=-4 * np.random.rand()#此时r取值范围是[-4,0]alpha=np.power(10,r)#即alpha=10^r,所以alpha取值范围是[10^-4,10^0]
如果在10^a和10^b之间取值,对于上述例子,此时的
对于计算指数加权平均值时用到的超参数
当
3 Batch归一化
Batch归一化是为了使参数的搜索简单化而提出的。
对于逻辑回归模型,我们对输入进行归一化处理:
对于多层的神经网络的化:
除了输入层,还有每层的激活值
当有L个隐藏层时,隐藏单元分别是
归一化方法:
为了使数值稳定,一般分母常常加一个
归一化的结果是均值0,标准单位方差,所以z的每个分量均值是0,方差是1。
但是我们不想隐藏单元都是总是均值是0,方差是1,也许隐藏单元有了不同分布,会有意义。所以,我们计算:
这里的
通过对
用
batch归一化仅仅适用于输入层还适用于隐藏层。输入层和隐藏层的归一化区别是,对于隐藏层,我们不想其均值一定是0,方差是1。比如对于激活函数是sigmoid,我们不想值都集中在某个局部,而是希望它有更大的方差或者不是0的均值,以便更好地使用非线性的sigmoid函数。否则,0均值和1方差,则值都集中在sigmoid函数的线性部分。
- DeepLearing学习笔记-改善深层神经网络(第三周- 超参数调试、正则化)
- DeepLearing学习笔记-改善深层神经网络(第三周- 将batch-norm拟合进神经网络)
- DeepLearing学习笔记-改善深层神经网络(第三周作业-TensorFlow使用)
- DeepLearing学习笔记-改善深层神经网络(第一周作业-2-正则化)
- DeepLearing学习笔记-改善深层神经网络(第一周作业-1)
- DeepLearning.ai学习笔记(二)改善深层神经网络:超参数调试、正则化以及优化--Week1深度学习的实用层面
- 2, 改善深层神经网络:超参数调试、正则化以及优化
- DeepLearing学习笔记-改善深层神经网络(第二周作业-优化方法)
- DeepLearing学习笔记-改善深层神经网络(第二周作业-优化方法)[转载]
- 改善深层神经网络:超参数调试、正则化以及优化——优化算法(2-2)
- DeepLearing学习笔记-改善深层神经网络(第一周作业-3-梯度校验)
- 改善深层神经网络:超参数调节(第一周)笔记
- 第2次课改善深层神经网络:超参数优化、正则化以及优化
- 第2次课改善深层神经网络:超参数优化、正则化以及优化
- 改善深度神经网络:超参数调试、正则化以及优化——深度学习的实践方面(2-1)
- [DeeplearningAI笔记]改善深层神经网络1.4_1.8深度学习实用层面_正则化Regularization与改善过拟合
- 改善深度神经网络:超参数调试、正则化以及优化(理论)——超参数调试、Batch正则化和程序框架(2-3)
- 吴恩达神经网络和深度学习课程自学笔记(七)之超参数调试,Batch正则化和程序框架
- java-容器
- cf 870 B
- 我的读书笔记——引用
- 微信小程序getPhoneNumber快速获取用户手机号组件
- Spring boot入门
- DeepLearing学习笔记-改善深层神经网络(第三周- 超参数调试、正则化)
- PullToRefreshListView加请求网络数据+imageloder
- Java反射机制
- 关于SVN防止误删,必须注释的脚本代码----分享
- 归并排序求逆序对
- Ubuntu16.04下安装中文输入法
- spfa求最短路模板(邻接矩阵)
- 面向对象设计的五个基本原则
- mysql温备份配置,每小时备份一次