程序博客网 > 软件推广联盟

神经网络基础—浅层神经网络

来源：互联网发布：软件推广联盟编辑：程序博客网时间：2024/06/16 00:24

来源： coursera DeepLearningAI-Shallow Neural Network 课程的笔记整理

浅层神经网络

浅层神经网络
- 层
- 表达方式
- 激活函数
  - 概述
  - 为何需要它
  - 常用激活函数的导数
随机初始化参数向量

层

可以将计算中的每一步视为神经网络的一个层。
隐藏层：不被观察到的层，大多数指在计算中未被表述的层。

表达方式

注意：输入不算层数。所以上层为一个2层神经网络
a[layer](example)node 用于表述一个神经元
同时我们一般采用计算层+ 激活层的方式来组建一个神经网络层。
大多数情况下，层的深入仅仅是计算方式的重复而已。同时需要考虑梯度计算的梯度消失问题

激活函数

概述

使用与隐藏层或输出层的一个函数（大多情况使用非线性函数）
隐藏层，可以考虑 tanh（a=ez−e−zez+e−z）：使得得到的资料集中于0，并非0.5。方便后面的学习
输出层，可以考虑Sigmod:使得得到值在0~1
当然，全用ReLu也是一个大众的做法.
ReLu的升级版为leaky ReLu a=max(0.01z,z)(渗漏整流函数)

为何需要它

打破计算层的线性特性
现实中大多数时间映射是非线性的，没有标准的因果关系。只有在做线性回归才会考虑在输出层使用线性激活

常用激活函数的导数

d d z s i g m o d (z) = A (1 - A), A = s i g m o d (z)

d d z t a n h (z) = 1 - (t a n h (z)) 2

d d z R e l u (z) = (0, z < 0 1, z > 0)

d d z L e a k y R e l u (z) = (0.01, z < 0 1, z > 0)

随机初始化参数向量

不像之前训练逻辑回归时全0初始化参数原因：会让所有的隐藏神经元做相同的工作
由于这种对称,反向传播后每个单元得到的梯度阵也是相同的
最后导致所有的神经元都做相同的计算
正确做法
W[1]=np.random.randn((shape))∗0.01。这样使得W每个元素初始化为很小的随机值
B则可以初始化为0，因为 W 参数阵已经可以让不同的单元做不同的工作
使用小的数字原因：防止使用 tanh sigmod 这类激活函数，反向时使得到的梯度值过小，影响学习率。

阅读全文

0 0

软件推广联盟

软件推广联盟

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子我爱你的日语日语专业就业方向学日语哪家好日语培训机构哪家好日语入门速成班日语培训中心日语初级入门日语外教一对一学习日语多少钱日语口语培训班快速学会日语日语专业学校日语学校排名日语基本入门日语怎么入门少儿日语培训班日语培训机构哪个好少儿日语培训职称日语培训班日语培训哪里好日语一对一教学日语初级培训学日语去哪里好实用日语100句日语快速入门教程日语入门教学学习日语要多长时间在线日语培训日语五十音图下载日语考级培训班日语一级培训班日语培训学习日语一级学习专业日语培训新世界日语学校在线日语培训班日语基本口语成人日语培训班经典日语歌曲日语专业四级日语培训班费用