程序博客网 > 英文域名在哪注册

典型相关分析

来源：互联网发布：英文域名在哪注册编辑：程序博客网时间：2024/05/17 21:55

[pdf版本] 典型相关分析.pdf

1. 问题

在线性回归中，我们使用直线来拟合样本点，寻找n维特征向量X和输出结果（或者叫做label）Y之间的线性关系。其中。然而当Y也是多维时，或者说Y也有多个特征时，我们希望分析出X和Y的关系。

当然我们仍然可以使用回归的方法来分析，做法如下：

假设，那么可以建立等式Y=AX如下

，形式和线性回归一样，需要训练m次得到m个和，解题正确率，理解程度和

来度量u和v的关系，我们期望寻求一组最优的解a和b，使得Corr(u, v)最大，这样得到的a和b就是使得u和v就有最大关联的权重。

到这里，基本上介绍了典型相关分析的目的。

2. CCA表示与求解

给定两组向量（替换之前的x为），，，默认

自己的协方差矩阵；右上角是，也是的协方差矩阵。

与之前一样，我们从的整体入手，定义

我们可以算出u和v的方差和协方差：

clip_image062

最后，我们需要算Corr(u,v)了

clip_image066

横轴是u，纵轴是v，这里我们期望通过调整a和b使得u和v的关系越像最后一个图越好。其实第一个图和最后一个图有联系的，我们可以调整a和b的符号，使得从第一个图变为最后一个。

接下来我们求解a和b。

回想在LDA中，也得到了类似Corr(u,v)的公式，我们在求解时固定了分母，来求分子（避免a和b同时扩大n倍仍然符号解条件的情况出现）。这里我们同样这么做。

这个优化问题的条件是：

Maximize

求解方法是构造Lagrangian等式，这里我简单推导如下：

，第二个左乘，得到

即是Corr(u,v)，只需找最大

令

显然，又回到了求特征值的老路上了，只要求得，那么Corr(u,v)和a和b都可以求出。

在上面的推导过程中，我们假设了均可逆。一般情况下都是可逆的，只有存在特征间线性相关时会出现不可逆的情况，在本文最后会提到不可逆的处理办法。

再次审视一下，如果直接去计算

这样先对和特征向量最大时的。那么称为典型变量（canonical variates），

Subject to:

其实第二组约束条件就是取和即和

clip_image150

，得

中的A不是一回事（这里符号有点乱，不好意思）。

然后对A求特征值和特征向量，得到

求b，这里，我们也可以采用类似求a的方法来求b。

回想之前的等式

我们将上面的式子代入下面的，得

求特征向量即可，注意的特征值相同，这个可以自己证明下。

不管使用哪种方法，

这里我们得到a和b的两组向量，到这还没完，我们需要让它们满足之前的约束条件

应该是我们之前得到的VecA中的列向量的m倍，我们只需要求得m，然后将VecA中的列向量乘以m即可。

是VecA的列向量。

clip_image180

第一组典型变量为

第二组典型变量为

这里的（解题正确率），（阅读理解程度）。他们前面的系数意思不是特征对单个u或v的贡献比重，而是从u和v整体关系看，当两者关系最密切时，特征计算时的权重。

4. Kernel Canonical Correlation Analysis（KCCA）

通常当我们发现特征的线性组合效果不够好或者两组集合关系是非线性的时候，我们会尝试核函数方法，这里我们继续介绍Kernel CCA。

在《支持向量机-核函数》那一篇中，大致介绍了一下核函数，这里再简单提一下：

当我们对两个向量作内积的时候

，和特征向量为 clip_image210

如果的构造一样，那么

这样，仅通过计算x和y的内积的平方就可以达到在高维空间（这里为和

即第列的元素是第个样例在核函数下的内积。

一个很好的核函数定义：

变换后，从n维特征上升到了N维特征，其中每一个特征是和

，这里的 clip_image248

其中

clip_image252

然后让L对a求导，令导数等于0，得到（这一步我没有验证，待会从宏观上解释一下）

clip_image256

求出c和d干嘛呢？c和d只是和，然后用K替换之，根本没有打算去计算出实际的让我们去做和将上升到高维，他们在高维对应的权重就是c和d。

虽然是在原始空间中（维度为样例个数M），但其作用点不是在原始特征上，而是原始样例上。看上面得出的c和d的公式就知道。和 clip_image268

表示可以将第i个样例上升到的N维向量， clip_image276

简写为

clip_image280

我们发现

和

这里维度可以不一样。

最后，我们得到Corr(u,v)

和，替换成了两个K乘积。

因此，得到的结果也是一样的，之前是

引入核函数后，得到

注意这里的两个w有点区别，前面的维度和y的特征数相同。后面的维度和y的样例数相同，严格来说“维度”。

5. 其他话题

1、当协方差矩阵不可逆时，怎么办？

要进行regularization。

一种方法是将前面的KCCA中的拉格朗日等式加上二次正则化项，即：

clip_image310

2、求Kernel矩阵效率不高怎么办？

使用Cholesky decomposition压缩法或者部分Gram-Schmidt正交化法，。

3、怎么使用CCA用来做预测？

先找出X和Y的典型相关系数，新来一个样例Xnew，在X中使用KNN，然后找到在Y中对应的N个样例，求均值或者带权重均值等预测Ynew。

4、如果有多个集合怎么办？X、Y、Z…？怎么衡量多个样本集的关系？

这个称为Generalization of the Canonical Correlation。方法是使得两两集合的距离差之和最小。可以参考文献2。

6. 参考文献

1、 http://www.stat.tamu.edu/~rrhocking/stat636/LEC-9.636.pdf

2、 Canonical correlation analysis: An overview with application to learning methods. David R. Hardoon , Sandor Szedmak and John Shawe-Taylor

3、 A kernel method for canonical correlation analysis. Shotaro Akaho

4、 Canonical Correlation a Tutorial. Magnus Borga

5、 Kernel Canonical Correlation Analysis. Max Welling

0 0

英文域名在哪注册

英文域名在哪注册

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子清雍正青花瓷雍正粉彩瓷器图片雍正珐琅瓷器雍正粉彩瓷器收购雍正五彩瓷器雍正几个儿子雍正铜钱价格表雍正小蝶年羹尧雍正粉彩价格雍正粉彩过枝桃纹盘雍正是第几个儿子爱新觉罗雍正大清雍正年制乾隆是雍正的第几个儿子雍正在位几年雍正粉彩瓷器鉴定拍卖雍正青花瓷器图片大清雍正年制瓷器图片雍正的传奇老婆雍正大钱价格雍正时期的青花瓷雍正御制珐琅彩瓶雍正民窑青花盘雍正时期的瓷器图片雍正的几个儿子雍正青花花浇雍正共有几个儿子雍正五彩鉴定雍正在位时间大清雍正瓷器图片雍正是康熙的第几个儿子雍正粉彩盘价格雍正为什么传位给乾隆康熙和雍正的关系雍正是康熙第几子雍正是怎么死的雍正有几个孩子雍正杀了几个兄弟雍正是篡位的吗雍正粉彩天球瓶雍正有没有篡位