PCA学习总结

来源:互联网 发布:软件职业技能培训学校 编辑:程序博客网 时间:2024/04/29 14:40

一. 定义
pca即主成分分析法,是一种常用的数据分析方法。PCA通过线性变换将原始数据变换成一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。
二. PCA数学原理
下面的博客上介绍的很清楚。觉得写的很棒
http://www.360doc.com/content/13/1124/02/9482_331688889.shtml
三. PCA算法
设有m条n维数据
1)将原始数据按列组成n行m列矩阵X
2)将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值。
3)求出协方差矩阵
4)求出协方差矩阵对应的特征值和特征向量
5)将特征向量按对应的特征值大小从上到下按行排列成 矩阵,取前K行组成矩阵P
6)Y=PX 即为降维到K维后的数据
四. 总结
PCA的本质是将方差最大的方向作为主特征,并且在各个正交方向上将数据“离”相关,也就是让他们在不能正交方向上没有相关性。
PCA是一种无参数技术,便于通用实现,无法进行个性化的优化。
五. 矩阵相关知识
矩阵是一个表示二维空间的数组,矩阵可以看做是一个变换。
下面的博客上介绍的很清晰。
http://www.cnblogs.com/chaosimple/archive/2013/07/04/3172039.html

0 0
原创粉丝点击