SVD原理及其应用导论

来源:互联网 发布:环信java注册 编辑:程序博客网 时间:2024/05/05 13:37

今天,来学习一种很重要的矩阵分解,叫做奇异值分解(Sigular Value Decomposition),简称SVD。

 

Contents

 

    1. 认识SVD

    2. SVD与广义逆矩阵

    3. SVD与最小二乘法

    4. SVD与数据压缩

    5. SVD与潜在语义分析

    6. SVD与低阶近似

 

 

1. 认识SVD

 

   在认识SVD之前,先来学习两个相关的概念:正交矩阵酉矩阵

 

   如果,则阶实矩阵称为正交矩阵。而酉矩阵是正交矩阵往复数域上的推广。

   判断正交矩阵和酉矩阵的充分必要条件是:。或者说正交矩阵和酉矩阵的共轭转置和它的

   逆矩阵相等。

 

   对任意矩阵,都能被奇异值分解为

 

   

 

   其中的正交矩阵,的正交矩阵,是由个沿对角线从大到小排列的奇异值

   组成的方阵,就是矩阵的秩。奇异值分解是一种正交矩阵分解法。

 

 

2. SVD与广义逆矩阵

 

   在认识矩阵的广义逆之前,先来回顾一下方阵的逆。

   对于一个的方阵,如果存在一个矩阵,使得,那么方阵的逆为

 

   那么对于非方阵来说情况又是怎样的? 比如对于的矩阵,它的逆是怎样计算的?这就是我将要

   讨论的广义逆矩阵

 

   矩阵的广义逆由Moore1920年提出,后来在1955年经过Penrose发展得到如下定义

 

   对任意复数矩阵,如果存在的矩阵,满足

 

   

 

   则称的一个Moore-Penrose逆,简称广义逆,记为。并把上面四个方程叫做Moore-Penrose

   方程,简称M-P方程

 

   由于M-P的四个方程都各有一定的解释,并且应用起来各有方便之处,所以出于不同的目的,常常考虑满足

   部分方程的,叫做弱逆,弱逆不唯一。为了引用方便,下面给出广义逆矩阵的定义

 

   对于的矩阵,若存在的矩阵,满足M-P方程中的全部或者其中的一部分,则称

   的广义逆矩阵

 

   实际上有结论:如果满足M-P方程中的全部四个条件,那么得到的矩阵是唯一的,如果只满足部分条件,

   那么得到的矩阵不唯一。也就是说一个矩阵Moore-Penrose逆是唯一的

 

   而广义逆的计算可以利用SVD分解得到,假设矩阵SVD分解为

 

   

 

   那么,不难验证

 

   

 

   有了广义逆矩阵,那么就可以用来求解线性方程组,假设现在已经知道了矩阵的广义逆

   如果矩阵的秩是,则其唯一解是,如果秩小于,则有无穷多组解,其中最小范数解仍然是

   ,通常我们关心的也就是这个解。

 

 

3. SVD与最小二乘法

 

   最常见的最小二乘问题是线性最小二乘问题。比如在三维空间有如下四个点

 

   

 

   现在用一个方程来拟合这四个点,这就是典型的线性最小二乘问题。

   接下来可以列出超定方程组,如下

 

   

 

   那么,进一步得到

 

   

 

   接下来用一个定理求最小二乘解,定理内容如下

 

   如上述超定系数方程组,一般情况下它是没有解的,但是我们可以让尽可能地小。解下面的方程

   可以求得方程的最小二乘解。

 

   

 

   这样最小二乘解又变成了解线性方程组问题,可以先用SVD来求出广义逆矩阵,然后解出。最终求得解为

 

   

 

 

4. SVD与数据压缩

 

    SVD在数据压缩方面有广泛的应用,比如图片压缩。我们知道电脑上的图像都是由一个一个像素点构成的,

   所以存储一张1000*622的图片,实际上是存储一个1000*622的矩阵,即一共622000个元素,这是一个

   很大的矩阵,实际上可以用奇异值分解并通过低阶近似的思想对图片进行压缩,但这是一种有损压缩,不

   过不影响图片的大致效果,链接:http://cos.name/2014/02/svd-and-image-compression/

 

   又比如在自然语言处理中,最常见的两个问题是将文本按主题归类和将词汇表中的字词按近义词归类,这

   两个问题都可以用SVD完美一次性地解决。首先,用一个大矩阵来描述成千上万篇文章和上百万词的关

   联性,在这个矩阵中,每一行代表一篇文章,每一列对应一个词。如果有个词,篇文章,那么就是如

   下的矩阵

    

       

 

   其中第行第列的元素,是字典中第个词在第篇文章中出现的加权词频,比如用词的TF-IDF值

   这个矩阵可能会很大,如果进行奇异值分解后,上述的两种分类也就完成了,而且存储空间也会减少很多。

 

 

5. SVD与潜在语义分析

 

   潜在语义分析(Latent Semantic Analysis),简称LSA,是一种用于自动地实现知识提取和表示的

   理论和方法,它通过对大量文本集进行统计分析,从中提取出词语的上下文使用含义。在技术上,它同向

   量空间模型类似,都是采用空间向量表示文本,但通过SVD分解等处理消除了同义词,多义词的影响,提

   高了后续处理的精度。

 

   关于潜在语义分析的论文,可以百度:潜在语义分析理论及其应用

  

 

6. SVD与低阶近似

 

   关于SVD的低阶近似参考:http://m.blog.csdn.net/blog/wangran51/7408414

 

 

更多关于SVD的文章参考

 

http://www.cnblogs.com/zhangchaoyang/articles/2575948.html

http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html

http://www.cnblogs.com/LeftNotEasy/archive/2011/01/08/lda-and-pca-machine-learning.html

http://www.cnblogs.com/FengYan/archive/2012/05/06/2480664.html

0 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 加挂账号不知道怎么办 钱打到对公账户怎么办 新中付没有到账怎么办 qq把钱转错了怎么办 转账输错号码怎么办 给别人转错钱了怎么办 转账到信用卡了怎么办 银行卡限额怎么办京东 预留信息忘了怎么办 中信银行香港卡怎么办 无银行预留信息怎么办 农工商超市红利卡怎么办 余额宝转入不了怎么办 公司车辆怎么办营运证 便利店转不出去怎么办 便利店开业营业额低怎么办 现在etc超时了怎么办? 中国银行e贷逾期怎么办 招商银行e分期逾期怎么办 保单贷款还不了怎么办 离婚时按揭房怎么办 按揭房子不要了怎么办? 征信有问题怎么办房贷 夫妻一方不做房贷共还人怎么办 给你花逾期一年怎么办 文件夹密码忘记了怎么办 网址被qq拦截怎么办 手机qq邮箱中毒怎么办 邮箱附件带病毒怎么办? 打开了病毒附件怎么办? qq邮箱被拦截怎么办 邮件地址已被注册怎么办 信用卡欠款怎么办房贷 贷款还不起了怎么办 装修贷款无抵押怎么办 黑户买房做贷款怎么办 易分期无法还款怎么办 工行晚还款一天怎么办 手机银行网页打不开怎么办 顺丰分拣错误怎么办 超市生意越来越差怎么办