Coursera机器学习-第四周-Neural Network ForwardPropagation
来源:互联网 发布:opencv骨架提取算法 编辑:程序博客网 时间:2024/06/01 09:05
Neural NetWork的由来
先考虑一个非线性分类,当特征数很少时,逻辑回归就可以完成了,但是当特征数变大时,高阶项将呈指数性增长,复杂度可想而知。如下图:对房屋进行高低档的分类,当特征值只有
这里的
符号说明:
a(j)i 表示第j层网络的第i个神经元,例如下图a(2)1 就表示第二层的第一个神经元θ(j) 表示从第j 层到第j+1 层的权重矩阵,例如下图所有的θ(1) 表示从第一层到第二层的权重矩阵θ(j)uv 表示从第j层的第v个神经元到第j+1层的第u个神经的权重,例如下图中θ(1)23 表示从第一层的第3个神经元到第二层的第2个神经元的权重,需要注意到的是下标uv是指v->u的权重而不是u->v,下图也给出了第一层到第二层的所有权重标注- 一般地,如果第j层有
sj 个神经元(不包括bias神经元),第j+1层有sj+1 个神经元(也不包括bias神经元),那么权重矩阵θj 的维度是(sj+1×(sj+1))
Forward propagation
第一层,称之为input Layer
第二层至最后一层,成为hidden layers:
最后一层是output layer:
通俗点说,向前传播就是上层处理完的数据作为你的输入数据,然后进行处理(权重),再传给下一层,这样逐层处理,最后输出。
由上述公式,我们可以看出: 第二层的第一个神经元
Vectorized Implementation
将上图内容提取出来:
更新公式简化为:
可以看到,我们由第一层的值,经过第一层的权重处理,得到第二层的值;由第二层的值,经过第二层的权重处理,计算第三层的值,得到预测的输出,计算的方式一层一层往前走的,这也是前向传播的名称由来。
与Logistic Regression的关系:
将上述图片抽离出来:
将
线性不可分问题:
实现AND操作:
图中{-30,20,20}分别表示{
实现NOT操作:实现NAND操作:实现XNOR操作:
该神经网络用到了之前的AND操作(用红色表示)、NAND操作(用青色表示)和OR操作(用绿色表示),从真值表可以看出,该神经网络成功地将(0, 0)(1,1)分为一类,(1,0)(0,1)分为一类,很好解决了线性不可分的问题。
符号说明:
m — 训练example的数量K — 最后一层(输出层)的神经元的个数,也等于分类数(分K 类,K≥3 )y(i)k — 第i 个训练exmaple的输出(长度为K 个向量)的第k 个分量值(hθ(x(i)))k — 对第i 个example用神经网络预测的输出(长度为K 的向量)的第k 个分量值L — 神经网络总共的层数(包括输入层和输出层)Θ(l) — 第l 层到第l+1 层的权重矩阵sl — 第l 层神经元的个数, 注意i 从1开始计数,bias神经元的权重不算在正则项内sl+1 — 第l+1 层神经元的个数
参考文章:
机器学习公开课笔记(4):神经网络(Neural Network)——表示
- Coursera机器学习-第四周-Neural Network ForwardPropagation
- coursera机器学习技法笔记(12)——Neural Network
- Coursera机器学习-第五周-Neural Network BackPropagation
- Coursera deep learning 吴恩达 神经网络和深度学习 第四周 编程作业 Building your Deep Neural Network
- 神经网络与深度学习第四周-Deep Neural Network
- 机器学习第4周:Neural Network概述
- 机器学习笔记-Neural Network
- Coursera Machine Learning 第四周 quiz Neural Networks: Representation
- DeepLearing学习笔记-Building your Deep Neural Network: Step by Step(第四周作业)
- DeepLearing学习笔记-Deep Neural Network在图像分类上的应用(第四周-作业2)
- 神经网络与深度学习第四周-Building your Deep Neural Network
- 机器学习第四周
- 机器学习: Python with Recurrent Neural Network
- 机器学习(十)- Neural Network representation
- 机器学习笔记——Neural Network
- Coursera机器学习课程笔记(5) Neural Networks Representation
- [Coursera机器学习]Neural Networks Learning WEEK5编程作业
- coursera机器学习笔记之“Neural Networks (part one)”
- ORA-00984列在此处不允许
- 贝叶斯估计
- C的|、||、&、&&、异或、~、!运算符
- Linux下重命名文件或文件夹(mv命令与rename命令)
- JSP 中 pageEncoding charset 的区别
- Coursera机器学习-第四周-Neural Network ForwardPropagation
- Appium的DesiredCapabilities参数设置
- 给按钮设置按下抬起状态
- Android Parcelable和Serializable的区别
- Cocoa Touch事件处理流程
- 笔试面试题
- spring java 获取webapp下文件路径
- Mozilla新特性只支持https网站,再次推动SSL证书普及
- 充分统计量