R语言学习十二

来源:互联网 发布:魔兽世界官方小说软件 编辑:程序博客网 时间:2024/06/07 00:36

主成分和因子分析

主成分分析(PCA)是一种数据降维技巧,它能将大量的相关变量转化为一组很少的不相关的变量,这些无关的变量称为主成分,例如,可以使用PCA把30个相关的信息转化为5个无关的成分变量,因为30个相关信息里面存在冗余。
探索性因子分析(EFA)是一种用来发现一组变量潜在结构的方法,可以通过寻找一组更小的,潜在的或隐藏的结构来解释已观测到的,显式的变量间的关系。
这里写图片描述
psych包中有用的因子分析函数:
这里写图片描述
这里写图片描述
这里写图片描述
使用principal()函数可以根据原始数据或者矩阵做主成分分析,格式为:principal(r,nfactors=,rotate=,scores=)
参数的解释如下:
这里写图片描述
这里写图片描述
这里写图片描述
以下是305个女孩身体指标间的相关系数:
这里写图片描述
我们需要用较少的变量来替换这些原始身体指标,如下代码可以判断提取的主成分数目:
这里写图片描述
如上图,其中碎石图,直线和x组成的连线,特征值大于1的准则线和100次模拟的平行分析,建议保留两个主成分。
这里写图片描述
这里写图片描述
可以看到,nfactors=2,说明两个主成分,proportion=0.58和0.22分别说明两个主成分代表的比例
这里写图片描述

0 0