MIT 线性代数(31—33)读书笔记
来源:互联网 发布:2k17mc模式奥尼尔数据 编辑:程序博客网 时间:2024/06/05 22:32
第三十一讲:线性变换及对应矩阵
本讲从线性变换这一概念出发,每个线性变换都对应于一个矩阵。矩阵变换的背后正是线性变换的概念。理解线性变换的方法就是确定它背后的矩阵,这是线性变换的本质
1 线性变换
1.1 定义
如何判断一个操作是不是线性变换?
线性变换需满足以下两个要求:
T(v+w)=T(v)+T(w)(1)
T(cv)=cT(v)(2) 即变换
T 需要同时满足加法和数乘不变的性质。将两个性质合成一个式子为:T(cv+dw)=cT(v)+dT(w)
特例:T(0)=0 。
这可以用来判断某些变换是否是线性变换。
1.2 例子
例1
二维空间中的投影操作,
“坏”例1
二维空间的平移操作,即平面平移:
比如,上图中向量长度翻倍,再做平移,明显与向量平移后再翻倍的结果不一致。
有时我们也可以用一个简单的特例判断线性变换,检查
所以平面平移操作并不是线性变换。
“坏”例2
求模运算,
例2
旋转
所以从上面的例子我们知道,投影与旋转都是线性变换。
例3
矩阵乘以向量,
线性变换的核心,就是该变换使用的相应的矩阵 。
例4
比如我们需要做一个线性变换,将一个三维向量降至二维,
如果我们希望知道线性变换
所以我们可以根据
现在我们需要考虑,如何把一个与坐标无关的线性变换变成一个与坐标有关的矩阵呢?
在
一个矩阵
A 用以表示线性变换T:Rn→Rm 。我们需要两组基,一组用以表示输入向量,一组用以表示输出向量。令v1,v2,⋯,vn 为输入向量的基,这些向量来自Rn ;w1,w2,⋯,wm 作为输出向量的基,这些向量来自Rm 。
例5
我们用二维空间的投影矩阵作为例子:
从图中可以看到,设输入向量的基为
找出这个矩阵并不困难,
本例中我们选取的基极为特殊,一个沿投影方向,另一个沿投影法线方向,其实这两个向量都是投影矩阵的特征向量,所以我们得到的线性变换矩阵是一个对角矩阵,这是一组很好的基。
所以,如果我们选取投影矩阵的特征向量作为基,则得到的线性变换矩阵将是一个包含投影矩阵特征值的对角矩阵。
继续这个例子,我们不再选取特征向量作为基,而使用标准基
2 变换矩阵
总结通用的计算线性变换矩阵
确定输入空间的基
v1,v2,⋯,vn ,确定输出空间的基w1,w2,⋯,wm ;计算
T(v1)=a11w1+a21w2+⋯+am1wm ,求出的系数ai1 就是矩阵A 的第一列;继续计算
T(v2)=a12w1+a22w2+⋯+am2wm ,求出的系数ai2 就是矩阵A 的第二列;以此类推计算剩余向量直到
vn ;最终得到矩阵
A=⎡⎣⎢⎢⎢⎢⎢a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn⎤⎦⎥⎥⎥⎥⎥ 。
矩阵的逆相当于线性变换的逆。矩阵的乘积相当于线性变换的乘积。矩阵乘法也源于线性变换
例1
最后我们介绍一种不一样的线性变换,
设输入为
c1+c2x+c3x3 ,基为1,x,x2 ;则输出为导数:
c2+2c3x ,基为1,x ;
所以我们需要求一个从三维输入空间到二维输出空间的线性变换,目的是求导。求导运算其实是线性变换,因此我们只要知道少量函数的求导法则(如
有
3 本站总结
1.线性变换的要求。
线性变换需满足以下两个要求:
T(v+w)=T(v)+T(w)(1)
T(cv)=cT(v)(2) 即变换
T 需要同时满足加法和数乘不变的性质。将两个性质合成一个式子为:T(cv+dw)=cT(v)+dT(w)
特例:T(0)=0 。
这可以用来判断某些变换是否是线性变换。
2.
第三十二讲:基变换和图像压缩
1. 图像压缩
1.1 定义
本讲我们介绍一种图片有损压缩的一种方法:JPEG。
假设我们有一张图片,长宽皆为
如此大的数据不经过压缩很难广泛传播。教学录像采用的压缩方法就是JPEG(Joint Photographic Expert Group,联合图像专家组),该方法采用的就是基变换的方式压缩图像。比如说一块干净的黑白,其附近的像素值应该非常接近,此时如果一个像素一个像素的描述黑白灰度值就太浪费空间了,所以标准基在这种情况下并不能很好的利用图片的特性。
我们知道,标准基是
我们试试使用别的基描述图片,比如:
基中含有的一个向量
[11⋯1]T ,即分量全为1 的向量,一个向量就可以完整的给出所有“像素一致图像”的信息;另一个向量
[1−1⋯1−1]T ,正负交替出现,比如描述国际象棋棋盘;第三个个向量
[11⋯−1−1]T ,一半正一半负,比如描述一半亮一半暗的图片;
1.2 傅里叶基
现在我们来介绍傅里叶基,以
每次处理
输入信号
x 为64 维向量−→−−基变换 输出信号c 为x 在傅里叶基下的64 个系数。注意前面做的都是无损的步骤,我们只是选了
R64 的一组基,接着把信号用这组基表达出来。
接下来的步骤就涉及到压缩和损失了:
一种方法是扔掉较小的系数,这叫做阈值量化(thresholding),我们设定一个阈值,任何不在阈值范围内的基向量、系数都将丢弃,虽然有信息损失,但是只要阈值设置合理,肉眼几乎无法区别压缩前后的图片。经由此步处理,向量
c 变为c^ ,而c^ 将有很多0 。通常
[11⋯1]T 向量很难被丢弃,它通常具有较大的系数。但是[1−1⋯1−1]T 向量在平滑信号中的可能性就很小了。前一个的向量称作低频信号,频率为0 ,后一个向量称作高频信号,也是我们能够得到的最高频率的信号,如果是噪音或抖动输出的就是它。比如讲课的视频图像信号,这种平滑的情形下输出的大多是低频信号,很少出现噪音。
接着我们用这些系数
c^ 来重构信号,用这些系数乘以对应的基向量x^=∑c^ivi ,但是这个求和不再是64 项求和了,因为压缩后的系数中有很多零存在,比如说我们压缩后c^ 中仅有三个非零项,那么压缩比将近达到21:1 。
我们再来提一下视频压缩:视频是一系列连续图像,且相近的帧非常接近,而我们的压缩算法就需要利用这个相近性质。在实际生活中,从时间与空间的角度讲,事物不会瞬间改变。
1.3 小波基
接下来介绍另一组基,它是傅里叶基的竞争对手,名为小波(wavelets),同样以
可以看出傅里叶基中频率最高的向量为小波后四个基向量之和。
在标准基下的一组(按八个一组计算,
此时我们发现,如果选取“好的基”会使得逆矩阵的求解过程变简单,所谓“好的基”:
计算快;
我们需要大量使用
P=WC 来计算整幅图在另一个基下的表达,在傅里叶变换中我们学习了快速傅里叶变换(FFT),同样的在小波变换中也有快速小波变换(FWT);另外的,我们需要计算其逆矩阵,所以这个逆矩阵计算也必须快,观察小波基不难发现基向量相互正交,假设我们已经对小波基做了标准化处理,则小波基是一组标准正交基,所以有
W−1=WT 。仅需少量向量即可最大限度的重现图像。
因为在图像压缩时,我们会舍弃较小的系数,比如
c5,c6,c7,c8 ,所以后四个的基向量都会被舍弃,重现图像时仅使用前四个基向量的线性组合,而好的基选取会在使用较少基的前提下保证图像质量不会有较大损失。题外话:JPEG2000标准会将小波基纳入压缩算法。我们上面介绍的是最简单的一组小波基,而FBI的指纹识别或JPEG2000的压缩算法纳入的是更加平滑的小波基,不会使用像上面介绍的那种直接从
1 变为−1 的基。
要想继续了解小波基,可以参考一篇非常精彩的文章:能不能通俗的讲解下傅立叶分析和小波分析之间的关系?——“咚懂咚懂咚“的答案
2. 基变换
前面介绍小波基的时候我们就已经做了一次基变换。
将目标基的向量按列组成矩阵
看一个例子,有线性变换
进行基变换时会发生两件事:
1.每个向量都会有一组新的坐标,而
2.每个线性变换都会有一个新的矩阵,而
再来看什么是
对于第一组基
而且
这些都是上一讲结尾所涉及的知识。
最后我们以一个更加特殊的基收场,设
继续使用线性变换中学到的,输入的第一个向量
这是一个非常完美的基,我们在图像处理中最想要的就是这种基,但是找出像素矩阵的特征向量代价太大,所以我们找了一些代价小同时效果也不错的基,比如小波基、傅里叶基等等。前几年的压缩感知也是通过这个思想(可以参考:形象易懂讲解算法II——压缩感知)
3.本章总结
- 图像压缩(定义,小波,傅立叶);
- 基变换。
第三十三讲:单元检测3复习
在上一次复习中,我们已经涉及了求特征值与特征向量(通过解方程
接下的章节来我们学习了:
解微分方程
dudt=Au ,并介绍了指数矩阵eAt ;介绍了对称矩阵的性质
A=AT ,了解了其特征值均为实数且总是存在足量的特征向量(即使特征值重复特征向量也不会短缺,总是可以对角化);同时对称矩阵的特征向量正交,所以对称矩阵对角化的结果可以表示为A=QΛQT ;接着我们学习了正定矩阵;
然后学习了相似矩阵,
B=M−1AM ,矩阵A,B 特征值相同,其实相似矩阵是用不同的基表示相同的东西;最后我们学习了奇异值分解
A=UΣVT 。
现在,我们继续通过例题复习这些知识点。
1. 解方程
首先通过
继续观察矩阵会发现
此时
另外,反对称矩阵同对称矩阵一样,具有正交的特征向量。当矩阵满足什么条件时,其特征向量相互正交?答案是必须满足
上面的解法并没有求特征向量,进而通过
2.已知矩阵的特征值
c 如何取值才能保证矩阵可以对角化?其实可对角化只需要有足够的特征向量即可,而现在特征向量已经足够,所以c 可以取任意值。c 如何取值才能保证矩阵对称?我们知道,对称矩阵的特征值均为实数,且注意到给出的特征向量是正交的,有了实特征值及正交特征向量,我们就可以得到对称矩阵。c 如何取值才能使得矩阵正定?已经有一个零特征值了,所以矩阵不可能是正定的,但可以是半正定的,如果c 去非负实数。c 如何取值才能使得矩阵是一个马尔科夫矩阵?在第二十四讲我们知道马尔科夫矩阵的性质:必有特征值等于1 ,其余特征值均小于1 ,所以A 不可能是马尔科夫矩阵。c 取何值才能使得P=A2 是一个投影矩阵?我们知道投影矩阵的一个重要性质是P2=P ,所以有对其特征值有λ2=λ ,则c=0,2 。
题设中的正交特征向量意义重大,如果没有正交这个条件,则矩阵
A 不会是对称、正定、投影矩阵。因为特征向量的正交性我们才能直接去看特征值的性质。
3.复习奇异值分解,
先求正交矩阵
V :ATA=VΣTUTUΣVT=V(ΣTΣ)VT ,所以V 是矩阵ATA 的特征向量矩阵,而矩阵ΣTΣ 是矩阵ATA 的特征值矩阵,即ATA 的特征值为σ2 。接下来应该求正交矩阵
U :AAT=UΣTVTVΣUT=U(ΣTΣ)UT ,但是请注意,我们在这个式子中无法确定特征向量的符号,我们需要使用Avi=σiui ,通过已经求出的vi 来确定ui 的符号(因为AV=UΣ ),进而求出U 。
已知
从已知的
4.
首先:
对于对称矩阵,有特征值均为实数;
然后是正交矩阵,直觉告诉我们|λ|=1 。
来证明一下,对于
A 是正定的吗?并不一定,因为特征向量可以取−1 。A 的特征值没有重复吗?不是,如果矩阵大于2 阶则必定有重复特征值,因为只能取±1 。A 可以被对角化吗?是的,任何对称矩阵、任何正交矩阵都可以被对角化。A 是非奇异矩阵吗?是的,正交矩阵都是非奇异矩阵。很明显它的特征值都不为零。
证明
我们使用投影矩阵的性质验证,首先由于
我们可以使用特征值验证,
- MIT 线性代数(31—33)读书笔记
- MIT 线性代数(1—3)读书笔记
- MIT 线性代数(4—6)读书笔记
- MIT 线性代数(7—9)读书笔记
- MIT 线性代数(10—12)读书笔记
- MIT 线性代数(13—15)读书笔记
- MIT 线性代数(16—18)读书笔记
- MIT 线性代数(19—21)读书笔记
- MIT 线性代数(22—24)读书笔记
- MIT 线性代数(25—27)读书笔记
- MIT 线性代数(28—30)读书笔记
- MIT 线性代数(34—35)读书笔记
- MIT线性代数学习(1)——求解线性方程组
- MIT 线性代数
- 看MIT的线性代数
- MIT线性代数--向量空间
- 线性代数MIT-0、前言
- MIT线性代数公开课
- 【Java Utility】Jsoup网页爬虫工具-使用选择器查找元素【八】
- spring与mybatis整合时mapper的配置问题
- ELK接入微服务工程
- POJ
- 常见内置指令知识点总结
- MIT 线性代数(31—33)读书笔记
- J2EE进阶之CSS 二
- mongoose简介及主要操作
- quickcocos2dx资源丢失的巨坑
- ADO.NET 快速入门(二):执行命令
- Web前端入门
- linux下中文名乱码
- 第二本书unit5 lvm管理
- HDU1709 The Balance(母函数)