深度学习的日记一:线性代数
来源:互联网 发布:php mysql 扩展 编辑:程序博客网 时间:2024/05/21 17:11
读书,记笔记,总结,回忆
一:标量,向量,矩阵和张量
1:标量 一个标量就是一个单独的数 斜体 小写 类似于集合上的元素
2:向量:一个向量是一列有序排列的数 通过索引确定每一个数 粗体小写 下标是索引
把向量看作空间中的点,每个元素都是不同坐标轴上的坐标(Wecan think ofvectors as identifyingpoints inspace, with eachelement giving the coordinatealong a differentaxis)
符号‘_’表示集合的补集中的索引。
3:矩阵:矩阵是一个二维数组,其中的每个元素都被两个索引确定。 粗体大写
Ifa real-valuedmatrix A has a height of m and a widthof n , then wesay that A∈R(m×n )上标
用‘:’表示某一行或者某一列的全部元素
4:张量: 一个数组中的元素分布在若干维坐标的规格网络中,为张量,多维数组,多个索引
5:转置 : 矩阵的转置是以对角线为轴的镜像。
向量的转置可以看作是只有一行的矩阵。将向量元素作为行矩阵写在文本行中,然后用转置操作将其转变为列向量。
标量是一个只有一个元素的矩阵,转置是它本身。
6:矩阵相加:前提是矩阵的形状一样。对应位置的元素 相加。
标量与矩阵相乘或相加:将其与矩阵的每个元素相乘或者相加
二:矩阵和向量相乘
矩阵A的列数必须和矩阵B的行数相等。C=AB
元素对应乘机:两个矩阵中元素的乘机
点积:两个相同维数的向量x和y的点积可以看作是x的转置和y的乘机
矩阵的乘机服从分布律也服从结合律
矩阵乘积不满足交换律,向量的点积满足
线性方程组:Ax=b A是一个已知矩阵,b属于一个向量,x是要求解的未知向量
三:单位矩阵和逆矩阵
任意向量和单位矩阵相乘都不会有什么改变。将保持n维向量不变的单位矩阵记作In
单位矩阵的主对角线的元素都为1,其余都为0
逆矩阵记作A^(-1)A=In
四:线性相关和生成子空间:
如果逆矩阵
(其中
方程组的解:无解,一个,无穷
线性组合其实就是利用两个向量得到另一个向量的方式。
为了分析方程有多少个解,我们可以将
一般而言,这种操作被称为线性组合(linear combination)。
形式上,一组向量的线性组合,是指每个向量乘以对应标量系数之后的和,即: ∑iciv(i).
生成子空间(span):向量生成了一个空间,意味着该空间由这些向量的全部线性组合组成。如:矩阵A的列向量生成了矩阵A的列空间
列空间:矩阵A中列向量的所有线性组合
零空间:满足Ax=0的所有解的集合
令 ,即矩阵A中的每一列看作一个列向量。那么,如果矩阵A的零空间仅包含零向量,则这三个向量是独立的;若包含非零向量,则这三个向量是相关的。
五:范数
衡量向量大小的函数被称为范数(norm)
形式为:其中,p属于实数,大于等于1
范数是指将向量映射到非负值的函数。直观上而言,向量x的范数衡量从原点到点x的距离。
范数是满足下列性质的任意函数:
L-P范数
与闵可夫斯基距离的定义一样,L-P范数不是一个范数,而是一组范数,其定义如下:
根据P 的变化,范数也有着不同的变化,一个经典的有关P范数的变化图如下:
上图表示了p从无穷到0变化时,三维空间中到原点的距离(范数)为1的点构成的图形的变化情况。以常见的L-2范数(p=2)为例,此时的范数也即欧氏距离,空间中到原点的欧氏距离为1的点构成了一个球面。
实际上,在0
平方L^2范数:可以通过点积x^Tx计算 对x中的每个元素的导数只取决于对应的元素 在原点附近增长很慢
L^2范数对每个元素的导数却和整个向量相关。
L2范数
L2范数是我们最常见最常用的范数了,我们用的最多的度量距离欧氏距离就是一种L2范数,它的定义如下:
表示向量元素的平方和再开平方。
像L1范数一样,L2也可以度量两个向量间的差异,如平方差和(Sum of Squared Difference):
对于L2范数,它的优化问题如下:
L2范数通常会被用来做优化目标函数的正则化项,防止模型为了迎合训练集而过于复杂造成过拟合的情况,从而提高模型的泛化能力。
L1范数
L1范数是我们经常见到的一种范数,它的定义如下:
表示向量
L1范数有很多的名字,例如我们熟悉的曼哈顿距离、最小绝对误差等。使用L1范数可以度量两个向量间的差异,如绝对误差和(Sum of Absolute Difference):
对于L1范数,它的优化问题如下:
当P=0时,也就是L0范数,由上面可知,L0范数并不是一个真正的范数,它主要被用来度量向量中非零元素的个数。用上面的L-P定义可以得到的L-0的定义为:
这里就有点问题了,我们知道非零元素的零次方为1,但零的零次方,非零数开零次方都是什么鬼,很不好说明L0的意义,所以在通常情况下,大家都用的是:
表示向量
对于L0范数,其优化问题为:
s.t. Ax=b
当P=
与L0一样,在通常情况下,大家都用的是:
来表示
- 深度学习的日记一:线性代数
- 深度学习日记(二) 线性代数二
- 深度学习线性代数基础
- 一文了解线性代数--深度学习入门之数学基础
- 线性代数学习(一)
- 深度学习日记1
- 深度学习日记 1
- 深度学习日记 2
- 深度学习汇报系列:(二)线性代数
- 深度学习第二章-线性代数笔记
- 深度学习数学基础之线性代数
- 深度学习系列笔记之线性代数
- 线性代数学习笔记一:行列式
- 线性代数学习笔记(一)
- 线性代数学习笔记(一)
- 浅谈线性代数的学习
- 深度学习框架Keras学习系列(一):线性代数基础与numpy使用(Linear Algebra Basis and Numpy)
- 线性代数(一): 何谓线性代数
- Java 异常处理
- Tensorflow快速入门
- ECMAScript6常用api介绍与使用
- 前端开发工程师必须关注的几个性能指标
- 下拉多选列表框
- 深度学习的日记一:线性代数
- mysql 双主迁移
- 关于<context:annotation-config/>
- 公有云市场持续演进,IaaS的优势扩大
- java.util.Collections
- Java并发编程:同步容器
- Spring错误问题java.lang.NoClassDefFoundError: org/springframework/aop/TargetSource
- xml与HTML的区别
- java 基础面试题1