PCA(主成分分析法)详解
来源:互联网 发布:网络摄像头ping不通 编辑:程序博客网 时间:2024/04/27 18:42
在数据预处理领域,经常遇到的一个问题就是数据降维,通常原始数据都处于一个高维空间中而对建模真正有用的数据则处于一个相对低维的流形之中,数据的众多分量之中存在冗余的相关关系,假若直接使用会带来不可接受的高昂的计算代价。PCA就是一种广泛应用的降维技术,除了解决维度灾难问题,它还可以用于数据可视化、有损压缩等应用领域。PCA本质上是将原始数据投影到低维线性空间上,其有两种优化目标,但都会导出一个同样的算法:一是投影后方差最大化,或者等价地使得投影后损失最小。
方差最大化
假设有一组数据{xn},n=1,2,3,…N,其处于一个D维空间中,我们的目标是将其投影到K维空间中并使得投影后的方差达到最大值。考虑这个K维子空间的一组互相正交的单位向量{un},n=1,2,…K,选择一个方向u1,故投影后的标量可以写成
损失最小化
考虑一组单位正交基{un},n=1,2,…D,每一个数据点都可以表示为
PCA
由上述推导总结算法过程如下:
- 求数据的协方差矩阵。这一步可以先对数据进行中心化
xn−x¯ 再求协方差。- 对协方差矩阵进行正交相似对角化,取正交阵的前K个向量,将原始数据投影到这个线性子空间
在数据预处理中经常要进行的一步便是标准化,使得每个分量均值为零,方差为单位方差。但是这种标准化并不能消除分量之间的相关性,换言之协方差矩阵并不是单位阵,通过PCA的变化则可以做到这一点。定义如下变换
高维空间下的PCA
在某些情景下,数据的维度可能远远大于数据的量,例如在对于一幅图片其维度可能达到百万级别(例如一张1080P的图片,每个像素点是一维),而求解一个
XTY=0⇒XXTY=0
XXTY=0⇒YTXXTY=0⇒(XTY)T(XTY)=0⇒XTY=0
又
- PCA(主成分分析法)详解
- PCA(主成分分析)详解
- 主成分分析(PCA)原理详解
- 主成分分析(PCA)原理详解
- 主成分分析PCA详解(二)
- PCA (主成分分析)详解
- 主成分分析(PCA)原理详解
- 主成分分析(PCA)原理详解
- 主成分分析(PCA)原理详解
- 主成分分析(PCA)原理详解
- 主成分分析(PCA)原理详解
- 主成分分析(PCA)原理详解
- 主成分分析(PCA)原理详解
- 主成分分析(PCA)原理详解
- 主成分分析(PCA)原理详解
- 主成分分析(PCA)原理详解
- 主成分分析(PCA)原理详解
- 主成分分析(PCA)原理详解
- 子网及子网掩码 问题
- Linux学习日志(六)
- 69 个经典 Spring 面试题和答案
- git svn简明使用教程
- STL学习——Stack/Queue篇
- PCA(主成分分析法)详解
- hdu oj 2444 The Accomodation of Students-二部图
- Luo1221 奇偶数
- UNICODE混合编程
- 编译和解释型语言的区别
- 打字第四天~
- POJ 2391 —— Ombrophobic Bovines 二分+Floyd+最大流
- LeetCode 84. Largest Rectangle in Histogram
- 面试题小结