PLSR（偏最小二乘回归浅析）

来源：互联网发布：字体设计软件下载编辑：程序博客网时间：2024/06/07 01:07

- - 问题描述
- 算法步骤
  - 分别提取两变量组的第一对线性组合组成的向量
  - 建立回归
  - 迭代
  - 最后

英文原文：Partial Least Squares (PLS) Regression.
相关博客：偏最小二乘回归

问题描述：

在实际问题中，经常会有多维回归预测问题，最小二乘法求解θ=(XTX)−1XTY：对于样本数m比样本的维度n要少的情况时， XTX为奇异矩阵，方程将有无穷多解，此时无法求解出实际的正确解。此时可以根据数据之间的相关性进行降维，主成分分析（PCA）是一种普遍利用的方法，不过在有标签并且要做回归的情况下，PLS更加适合此类问题。

算法步骤

首先定义数据 ,假设已经获得了归一化之后的数据以及对应的标签
X0=⎡⎣⎢⎢⎢x11x21...xn1x12x22...xn2............x1mx2m...xnm⎤⎦⎥⎥⎥,Y0=⎡⎣⎢⎢⎢⎢y11y21...yn1y12y22...yn2............y1py2p...ynp⎤⎦⎥⎥⎥⎥

其中，样本数量为n个，X为m维数据，Y为p维标签
偏最小二乘回归分析建模的具体步骤如下：

分别提取两变量组的第一对线性组合组成的向量：

这里不用得分向量那种大部分文献常用的方法，来说一种比较简洁的计算方法，直接在数据矩阵当中提取主成分，
t1=x1w11+...+xmw1n=Xw1,X=(x1,...,xm)
u1=y1v11+...+ypv1p=Yv1,Y=(y1,...,yp)
t1是m个n维的数据向量（列向量）的线性组合(每一个向量长度为样本数量)， u1是p个n维的标签列向量的线性组合，其中w1,v1为单位向量，各自尽可能多地体现其组成成分的信息。
另 t1 和u1 的相关程度达到最大
问题化为求单位向量w1,v1，,使 θ=wT1XTYv1达到最大。

{m a x : w T 1 w 1 < t 1, u 1 > = < X w 1, Y v 1 > = w T 1 X T Y v 1 = ∥ w 1 ∥ 2 = 1, v T 1 v 1 = ∥ v 1 ∥ 2 = 1

根据PCA原理

XTY的主成分，就是计算

XTY的协方差矩阵

M=XTYYTX的特征值和特征向量，源矩阵和转置矩阵的特征值相同（这里求

M=YTXXTY是一样的，特征值相同，只是特征向量差了乘

YTX的线性变换）

M的最大特征值为

θ2,相应的单位特征向量就是所求的

w1,

v1可以通过

w1计算

v1=1θ1YTXw1

建立回归

建立Y=(y1,...,yp)对t1的回归及X=(x1,...,xm)对t1的回归模型：

{X 0 Y 0 = t 1 α 1 + X 1 = t 1 β 1 + Y 1

由于和相关性上已经达到最大化（

t1≈

u1），这里使用

t1替换

u1对Y进行回归，从而之后间接用X的成分对Y进行回归。其中

α1=(α11,...,α1m),β1=(β11,...,β1p)分别是多对一的回归模型中的参数向量，

X1和

Y!是残差阵。回归系数向量

α,

β的最小二乘估计为

⎧ ⎩ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ α 1 β 1 = t T 1 X 0 ∥ t 1 ∥ 2 = t T 1 Y 0 ∥ t 1 ∥ 2

迭代

如果残差范数不满足要求的阈值，则用残差阵X1和Y!代替X0和Y0重复以上步骤。
w2=(w21,...,w2m),v2=(v21,...,v2p)分别为第二对单位向量。
t2=Xw2,u2=Yv2第二对成分的线性组合。
β2=tT2Y1∥t2∥2,β2=tT2Y1∥t2∥2分别为 X ,Y 的回归模型中第二对成分的参数向量，这时可以得到：

{X 0 Y 0 = t 1 α 1 + t 2 α 2 + X 2 = t 1 β 1 + t 2 β 2 + Y 2

误差矩阵的范数满足一定条件则可以停止，最多可以存在r个成分X（数据阵）的秩

{X 0 Y 0 = t 1 α 1 + t 2 α 2 + . . . + t r α r + X r = t 1 β 1 + t 2 β 2 + . . . + t r β r + Y r

这里与PCA中表达式不一样的是这里成分向量之间没有正交的要求。

最后

将
tk=Xwk=x1wk1+...+xmwkn,k=(1,2,...,r)
带入到
Y0=t1β1+t2β2+...+trβr
当中。即可得到p个标签的偏最小二乘回归方程。
Y0=Xw1β1+Xw2β2+...+Xwrβr+Yr=Xp1+Xp2+...+Xpr
pk=wkβk,k=(1,...r)

1 0