courseras NN_for_ml系列(lecture 2 )
来源:互联网 发布:淘宝旺铺装修 编辑:程序博客网 时间:2024/06/05 03:54
- 神经网络构架主要的综述
- 感知器的几何描述 之 向量空间
- 为什么感知器有效
- 感知器不能做的事
神经网络构架主要的综述
这一节将会讲解3中神经网络模型。分别为前馈神经网络(Feed-forward neural networks ),循环神经网络(Recurrent networks),对称连接网络(symmetrically-connected network)
前馈神经网络是在应用中最普遍的神经网络模型。
形状为:
最底层是输入层,最上层是输出层。中间有一个或者更多个层的隐藏单元。
循环神经网络比前馈神经网络更加厉害。
形状为:
循环是一个有向圆。也就是你从一个节点出发,沿着一个箭头的方向,是可以再次回到这个节点的。但是循环神经网络很难训练。
感知器的几何描述 之 向量空间
这里训练案例training case是一个向量,而不是一群向量的集合。
我们可以把训练案例转换成平面 然后尝试学习得到所有训练平面右侧的权值向量
在权重空间里,每一个点表示一个权重向量。每一条直线由一个输入训练点表示。在权重向量中,也就是一个训练点(x)可以确定一条直线,这条直线有无穷多个点组合,即这条直线有无穷多个权重向量(即权重向量的集合)组合,其中这些权重向量与这个训练点的点积恒为零。
我们先不考虑阈值b。假设每一个数据点是n维的
这里我们讨论的是权值空间。那么这个权值空间就是n维的。其中每一个点表示的是一个权重向量
将权值空间 与 以前的训练数据空间 进行对比:
在权值空间中,一条边是一群与某一个训练案例 的点积为 0 的 权值向量组成。且这条边可以将权值空间所有的权值向量分成2等份。线的一边全部都是好的权值向量,另一边全部都是坏的权值向量。
假设,现在这一个训练案例的label为1。
我们知道,边上面的w与这个训练案例的点积为0。那么要想正确的将训练案例区分正确,就必须wx>0,即w与x的夹角必须小于0。如果大于0,就会分错。
同理,如果这一个训练案例的label为0。则w与x的夹角必须大于0
当我们有两个点时,也就形成了两条边。那么全部正确区分的权值空间应该是下面绿色部分。
为什么感知器有效
假设一定存在一个向量来正确的划分所有的训练点。现在我们证明感知器一定能够找到这个向量。
从一个向量出发,如果使得某一训练点区分错误的话,就不断更新自己,使自己不断接近于所有的可行权重向量。
感知器不能做的事
感知器的限制你使用的特征。特征选择的好,那么感知器可以做任何事;特征选择的不好,那么所有的学习都将会受到限制
一旦一个特征被决定,那么这个感知器能够学到的东西就受到了极大的限制。
还有就是,因为什么原因使得需要的特征呈指数上升,这内容没听懂
我们可以用代数说明感知器解决不了这种问题其中
如果用几何的方法解释,很显然,这是无法线性可分的。
wrap-around
下面一部分没听懂,摘抄自博客http://blog.csdn.net/ycheng_sjtu/article/details/47724949
- courseras NN_for_ml系列(lecture 2 )
- courseras NN_for_ml系列(lecture 3)
- Lecture 2 opencv2系列之初识Mat
- Lecture 2
- CS231n系列之Lecture 2: Image Classification pipeline
- Lecture 1 & 2
- Lecture 2(下)
- Lecture 2 Gradient descent
- cs231n Lecture 2
- Lecture 2: PLA 演算法
- CS109 Lecture 2
- Lecture 2 放大器
- Lecture 1&2
- Lecture 2 Asymptotic Notation
- Lecture 3 (二)
- Lecture 4(下)
- Lecture 5(下)
- Lecture 1 opencv2系列之读取图像
- 函数绑定器
- Monkey总结(三)
- 请求Requst中获取访问请求的客户端IP
- php通过mht文件方式生成带图片的word文档
- birt 显示源sql调试
- courseras NN_for_ml系列(lecture 2 )
- 单例对象的释放
- tomcat https访问配置
- Linux 缺少动态链接库
- Monkey总结(四)
- 设计模式之建造者模式(Builder)
- sizeof和strlen使用技巧
- it-linux--centos安装chrome
- (Leetcode)53. Maximum Subarray(medium)