Deep learning 中的数学基础知识
来源:互联网 发布:java在线直播平台源码 编辑:程序博客网 时间:2024/06/07 03:30
1.微积分
导数:一个函数在某一点的导数描述了这个函数在这一点附近的变化率。
梯度:多元函数的导数就是梯度。
一阶导数和梯度(gradient)
二阶导数与Hessian矩阵:
泰勒级数:
输入为标量的泰勒级数:
输入为矢量的泰勒级数(前三项):
此时 满足
如果
问题:为什么优化时选择梯度方向,梯度方向为什么是变化最快的方向?
答:由泰勒级数展开式的前两项
2. 概率论
随机变量
累积分布函数
概率密度函数
高斯分布
独立同分布定理
3. 线性代数
方阵的特征值(Eigenvalues)与特征向量(Eigenvectors)
特征值和特征向量的几何意义与物理意义**:
矩阵是数学中非常抽象的一个概念,广义上我们可以将矩阵看作一个运动。即矩阵乘法对应了一个变换,是把任意一个向量变成另一个方向或长度都大多不同的新向量。在这个变换过程中,原向量主要发生旋转、伸缩的变化。 如果矩阵对某个或某些向量只发生伸缩变换,而不对这些向量产生旋转的效果,那么这些向量就称作这个矩阵的特征向量,伸缩的比例就是特征值。其物理意义就是运动的图景:特征向量在一个矩阵的作用下作伸缩运动,伸缩的幅度由特征值确定。
特征分解的性质:
对于
其中
并不是所有的方阵都可以被对角化,这里主要考虑对称矩阵(
如果一个对称矩阵的特征值都不相同,则其相应的所有特征向量正交。(
对称矩阵的特征值都是实数。
二次型**(Quadratic Form):
给定矩阵
被称为二次型。
如果对于所有
特征分解的应用——PCA的本质
PCA的本质就是协方差矩阵的对角化。
4. 凸优化问题
凸集:一个集合中任意两点的连线都在该集合中,则这个集合是一个凸集。
一个函数
它的定义域是凸集;
对于定义域中的任意两点
x1 、x2 , 对任意0≤α≤1 , 有
机器学习中的凸优化问题是一类特殊的优化问题。凸优化问题的形式是
其中
其中
凸优化问题的性质:它的局部最优解一定是全局最优解。
无约束条件的凸优化问题,用梯度下降法或牛顿法进行求解;有约束条件的优化问题转化为广义Lagerange 乘子形式,再根据KKT 条件进行优化求解。
- Deep learning 中的数学基础知识
- Deep Reinforcement Learning 基础知识
- Deep Learning的数学思考
- Deep learning:一(基础知识_1)
- Deep learning:一(基础知识_1)
- Deep learning:七(基础知识_2)
- Deep learning:一(基础知识_1)
- Deep learning:一(基础知识_1)
- Deep learning:七(基础知识_2)
- Deep learning:一 (基础知识_1)
- Deep learning:一(基础知识_1)
- Deep learning:三十二(基础知识_3)
- Deep learning:一(基础知识_1)
- Deep learning:一(基础知识_1)
- Deep Learning 深度学习笔记1(基础知识)
- Deep Reinforcement Learning 基础知识(DQN方面)
- Deep Reinforcement Learning 基础知识(DQN方面)
- Deep learning:一(基础知识_1)
- 学生成绩转换
- jvm(七):内存分配与回收
- poj1035,用字典树失败
- Java工程师如何从普通成为大神值得一读 火推
- 如何画好visio图
- Deep learning 中的数学基础知识
- java作业
- java棋盘图案
- 方法finalizer()的应用
- Docker-note 从入门到
- 从注解和JAVA配置的角度看Spring
- 详解 Java 中的访问控制修饰符(public, protected, default, private)
- 建造神经网络
- Linux C语言删除文件