程序博客网 > 企业qq for mac版

机器学习（十）：PCA

来源：互联网发布：企业qq for mac版编辑：程序博客网时间：2024/05/29 19:19

1. PCA

1.1 PCA算法

为什么要使用主成分分析？正如名字所示，其目的显而易见，不再赘述，此处从自动编码器的角度审视PCA。
这里写图片描述
最小化如下损失函数：

C = 1 2 m \sum i = 1 m | | y (i) - W W T x (i) | | 2

根据

WWT的对称性，我们使用eigen-decompose：

W W T = V D V T

其中V是单位正交阵，D是对角矩阵，都是d*d维，

VVT=I，

D中的非零值小于

d¯个。

我们可以从物理意义上来解析h(x)到底干了什么：

VTx首先对x进行坐标变换。此处V是d*d维，x是d维，所以此处对应的是将向量x旋转；

D(VTx)，因为D中非零值小于d¯个，所以其作用是将≥(d−d¯个分量设为0，其余分量进行scale。

V(DVTx)将上述操作后的变量变回原来的坐标系，此处对应的是将向量旋转回来。

| | y - W W T | | 2 = | | V I V T x - V D V T x | | 2 = [V (I V T x - D V T x)] T [V (I V T x - D V T x)] = (I V T x - D V T x) T (I V T x - D V T x) = | | (I - D) V T x | | 2

那么我们的问题变成：

min V min D 1 2 m \sum i = 1 m | | (I - D) V T x (i) | | 2

首先对内层最小化，很明显

I−D中的0越多越好：
这里写图片描述

这里写图片描述

接下来我们就外层进行最小化，很明显
这里写图片描述

假设d¯=1,则VT只会保留下第一行vT，则有

m a x v \sum i = 1 m v T x (i) x (i) T v s . t . v T v = 1

如何求解？令

J = v T X T X v - λ (v T v - 1)

令偏微分等于0，有

X T X v = λ v

此时有

m a x v v T X T X v = λ

什么意思呢？我们只要对

XTX进行特征分解即可。
这里写图片描述

这里写图片描述

这里写图片描述

1.2 PCA使用注意事项

这里写图片描述
如果输入的多个维度数值不在同一尺度下，那么可以先将数值都变换到同一尺度。

如何选择d¯？
这里写图片描述

一定要记住，不要过早地使用PCA。
这里写图片描述

0 0

企业qq for mac版

企业qq for mac版

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子驿动的心歌词心火烧歌词心止如水歌词追梦赤子心歌词心如止水的歌词你不懂我的心歌词没了心的爱歌词问心歌词是谁的心啊歌词赤子之心歌词心如止水歌词英文是什么意思风语暖心完整歌词歌词是谁的心啊孤单的留下心如止水歌词是什么意思带心的歌词心的歌词问心无愧歌词心谈歌词听心的歌词月亮代表我的心歌词明明白白我的心歌词月亮代表我的心歌词心气心浮气躁是什么意思心海城连云港海州心海州海州海州市属于哪个省海州市连云港海州湾度假区海州区海州古城连云港海州区邮编海州湾旅游度假区如东海州大酒店清鼻堂清堂鼻清堂心清堂化妆品是大品牌吗清颜堂祛痘贵吗