7.deep learning
来源:互联网 发布:单片机一帧是什么意思 编辑:程序博客网 时间:2024/06/05 22:30
deep learning
这些矩阵运算可以用GPU加速,比CPU快
softmax怎么理解?没毛病
就是把一堆实数的值映射到0-1区间,并且使他们的和为1。一般用来估计posterior probability,在多分类任务中有用到。
如何抽FEATURE变成了如何设计network structure
这些toolkit可以用来算微分,backpropagation
和直线拟合一样,深度学习的训练也有一个目标函数,这个目标函数定义了什么样的参数才算一组“好参数”,不过在机器学习中,一般是采用成本函数(cost function),然后,训练目标就是通过调整每一个权值Wij来使得cost达到最小。cost函数也可以看成是由所有待求权值Wij为自变量的复合函数,而且基本上是非凸的,即含有许多局部最小值。但实际中发现,采用我们常用的梯度下降法就可以有效的求解最小化cost函数的问题。
梯度下降法需要给定一个初始点,并求出该点的梯度向量,然后以负梯度方向为搜索方向,以一定的步长进行搜索,从而确定下一个迭代点,再计算该新的梯度方向,如此重复直到cost收敛。那么如何计算梯度呢?
梯度下降法需要给定一个初始点,并求出该点的梯度向量,然后以负梯度方向为搜索方向,以一定的步长进行搜索,从而确定下一个迭代点,再计算该新的梯度方向,如此重复直到cost收敛。那么如何计算梯度呢?
阅读全文
0 0
- 7.deep learning
- Deep learning
- deep learning
- 【deep learning】
- Deep Learning
- Deep Learning
- deep learning
- Deep learning
- deep learning
- Deep Learning
- Deep Learning
- 【deep learning】
- deep learning
- deep learning
- Deep Learning
- Deep Learning
- Deep Learning
- Deep Learning
- Form-实验吧
- 内核源码阅读(一)进程
- Android学习(一)RelativeLayout布局属性
- js中浮点型运算
- c++知识总结(2)
- 7.deep learning
- Java中boolean类型占用多少个字节
- Java面试05|MySQL及InnoDB引擎
- C语言之进程控制(僵尸进程和守护进程)
- 正则中的text()、exec()、match()等的用方法
- java事件模型
- 设计简单的ArrayList集合功能
- Java面试07|Redis数据库
- I Hate It (HDU