PCA和矩阵

来源:互联网 发布:网络语开挂是什么意思 编辑:程序博客网 时间:2024/06/04 19:31

PCA就是主成分分析,这是个无监督的数据处理过程


目的是把原有的数据降低到一个比较小的维度,便于后续的处理


整个过程的理论是:


原有m个样本,每个样本为n维向量,那么可组成一个n*m的矩阵S


找到一个矩阵A,将上面的样本矩阵映射到A中,假设A为k*n的矩阵


矩阵映射过程就是A矩阵左乘S矩阵得到矩阵E, 那么E为k*m的矩阵


如果k<<n的话,那么就成功的把n维向量映射到了k维向量中,这里的问题就是这个基矩阵A是如何找到的


主要使用的方法就是方差尽量大,而且还要不相关,所以既要使用方差又要使用协方差


贴一篇写的很好的博客:http://blog.codinglabs.org/articles/pca-tutorial.html


其实这里对矩阵的理解还是比较关键,有兴趣的同学可以看上面博客的内容


有两个矩阵很有用,协方差矩阵和拉普拉斯矩阵,有空再分析

1 0