【机器学习】PCA的数学原理
来源:互联网 发布:淘宝标题优化技巧 编辑:程序博客网 时间:2024/05/23 21:38
PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其中的原理。这篇文章的目的是介绍PCA的基本数学原理,帮助读者了解PCA的工作机制是什么。
当然我并不打算把文章写成纯数学文章,而是希望用直观和易懂的方式叙述PCA的数学原理,所以整个文章不会引入严格的数学推导。希望读者在看完这篇文章后能更好的明白PCA的工作原理。
数据的向量表示及降维问题
一般情况下,在数据挖掘和机器学习中,数据被表示为向量。例如某个淘宝店2012年全年的流量及交易情况可以看成一组记录的集合,其中每一天的数据是一条记录,格式如下:
(日期, 浏览量, 访客数, 下单数, 成交数, 成交金额)
其中“日期”是一个记录标志而非度量值,而数据挖掘关心的大多是度量值,因此如果我们忽略日期这个字段后,我们得到一组记录,每条记录可以被表示为一个五维向量,其中一条看起来大约是这个样子:
0 0
- 【机器学习】PCA的数学原理
- 机器学习中的数学(7)——PCA的数学原理
- 数学建模|机器学习|主成分分析原理(PCA)
- 机器学习经典之PCA的数学原理(很值得读)
- PCA的数学原理
- PCA的数学原理
- PCA的数学原理
- PCA的数学原理
- PCA的数学原理
- PCA的数学原理
- PCA的数学原理
- PCA的数学原理
- PCA的数学原理
- PCA的数学原理
- PCA的数学原理
- PCA的数学原理
- PCA的数学原理
- PCA的数学原理
- java守护线程
- java.lang.classcastexception org.ksoap2.soapfault cannot be cast to org.ksoap2.serialization.soapobj
- Linux进程控制编程(八)
- Python-MySQLdb _mysql.c(42)错误
- centos 7 下安装 mongodb
- 【机器学习】PCA的数学原理
- AndroidStudio中如何引入aar文件和jar文件
- 关于HTTP和HTTPS的权限开关
- Spring 的 BeanPostProcessor接口实现
- ActivityGroup中onBackPressed无效
- Python Tornado Echarts 之坑一
- js实现进度条(不带百分比)
- 从操作系统设计角度看分页机制
- git日志导出为csv格式文件、excel格式文件