关于PCA算法学习心得

来源:互联网 发布:李乐的霍去病 知乎 编辑:程序博客网 时间:2024/06/06 05:21

学习的过程中,以下链接对我帮助较大:
链接:http://blog.codinglabs.org/articles/pca-tutorial.html

压缩的实质就是针对样本的属性,让单个属性的方差最大,让样本之间的协方差的为零。PCA算法的是针对原始样本的协方差C的变换,通过对协方差矩阵C的对角化,找到映射后的样本的协方差矩阵Y。需要注意的是,此时D是对角阵,从而满足了我们优化的要求——协方差为零,方差最大。

D=====1mYYT1m(PX)(PX)T1mPXXTPTP(1mXXT)PTPCPT

然后原始的样本即可通过正交阵的变化,获得映射后的样本坐标。接着,在一定压缩率的条件下,选取特征值较大的属性,完成特征压缩。

  1. 关于样本数据是否需要去中心化的问题
    参考以下链接:
    Centering对PCA的影响
    Centering在PCA中与Intercept的关系
原创粉丝点击