学习Factor Anaylsis and Multi-factor analysis的体会

来源:互联网 发布:python y=lnx图像 编辑:程序博客网 时间:2024/05/13 18:54
Factor Analysis ,不知道在中文里怎么说,知道的同学请告诉我。其实字面意思已经告诉我们它是干什么的了,那就是因素分析,也就是分析一个事情的成因--有哪些因素与这个事情有关,可以影响这个事情。严谨一点来说,它是一种统计分析,是分析统计变量之间的关联性的。对于一组统计变量,他们一起互相影响着发生一些变化,我们很想知道隐藏在这些变化之后的东西是什么。这些隐藏在这些变化后的东西也许能更准确地描述我们需要的信息,而且可能具有比能观察到的变化更低的维数。我们需要这种抽象。Factor Anaylsis就是给我们提供一些方法,来分析这些变量之间的关联以及关联背后的东西的,从而实现这个抽象的过程。更重要的是,Factor Anaylsis还能告诉我们怎么用最少的特征,距离最远的特征来描述这些关联和变化,所以PCA(Principal Component Analysis)是Factor Anaylsis比不可少的一个实现方法。

用例子说明会简单些。有些事物是可以观察的和容易定量描述的,比如学生的考试成绩,高就是高,低就是低,一目了然,想用某科的考试成绩来分析学生很简单。但是学生的资质就是一个很不容易观察和定量描述的东西,其他不容易观察和定量分析的例子还包括人的智力、EQ、人格特質、食物偏好、消費者的購買行為等。對於這些無法明確表示(抽象的)或無法測量的因素,我们可以經由一些可以測量的變數,加以訂定出這些因素,这就是factor analysis的目的和作用。回到衡量学生资质的例子,因为学生资质是个不好定量描述的东西,我们设计十门考试这些可以定量描述的变量,通过factor analysis,找出隐含的,也就是隐藏在考试成绩背后的,维数比十门考试成绩更低的却更能准确说明学生资质的东西(factors)来衡量学生的资质。这就是factor analysis可以帮我们做到的。因为大家都知道考试成绩在反映学生资质问题上各科之间可能有很大冗余,并不是互相独立的。Factor analysis不仅可以帮我们找到可以衡量学生资质的不容易量化测量的东西,还可以保证这些东西是最能说明问题的,最简洁的,各个因素之间没有冗余的。再用比较严谨的话来说就是Factor Anaylsis帮我们找到的这些能说明学生资质的东西维数最低,各维之间相关性最小或者根本不相关(正交)。


可能说了半天也没说明白,不明白的同学请举手呵呵



原创粉丝点击