数据科学之机器学习17:因子分析2
来源:互联网 发布:matlab2016a mac 破解 编辑:程序博客网 时间:2024/04/29 04:26
图片来源于网址
“文章原创,转载请注明出处”
这两天来了个同学,大家聚了聚,我也乘机休息了两天(好奢侈!)。这两天属于什么都没有写,就翻看了两本书。一本是二月河的康熙大帝,另外一本是推荐系统实践,这本书的电子版,图灵正在打折,有兴趣可以买本看看。
好了,不废话了,下面就接着上一篇讲的继续!上一篇简单介绍了因子分析的一些概念,以及最基础的因子模型:正交因子模型。那么这一篇,就来说说正交因子模型的参数估计问题。
对于一组p维样本,有n个观测值:
在因子模型中,需要估计的有两个参数:因子载荷矩阵
1. 主成分法
主成分法的思想取自于主成分分析,即是取出前m个成分作为主成分,然后以此来得到因子载荷矩阵的估计;然后再以协方差阵和因子载荷矩阵为条件,直接推出特殊方差矩阵。具体如下:
- 求出协方差矩阵
S 的特征值:λ^1⩾λ^2⩾⋯⩾λ^p⩾0 ,其对应的特征向量为:t^1,t^2,…,t^p 。 - 选一个较小因子数
m ,并且使得前m项累计贡献率∑mi=1λ^i∑pi=1λ^i 高于设定值。 - 将协方差矩阵
S 做这样的近似:S=∑mi=1λ^i+∑pi=m+1λ^i≈∑mi=1λ^i+D^:=A^A^′+D^
其中,
从上述的过程来看,我们是使用了一种近似的方法估计出了
2. 主因子法
对于因子模型,我们先对原始向量进行标准化,则有:
其中
计算
那么
可以看到,这是一个可以迭代的过程,我们可以一直迭代,直到结果达到稳定为止!从过程来看,这里其实也是利用了主成分,因而,主因子法也是主成分法的一种修正!
那么接下来的问题就是,这个特殊方差
3. 极大似然法
使用极大似然估计,那么就肯定需要使用样本的分布,这里我们假定公共因子
有了上述假设,通过模型就可以知道
一般情况下,极大似然法使用得并不太多,因为这个方法是算不出显式解的,在没有限制条件的情况下,解也并不唯一确定!但是如果是在因子分部可以明显知道的情况下,使用这个方法就比较好了!
总结
到这边,对于基础的因子模型就介绍结束了。回顾一下,主要就是介绍了正交因子模型以及它的参数估计问题。但是,到这里,我们还没有说到模型中的公共因子如何解释这个问题!对于这个问题的解释,通常结合实际的问题,需要一定的专业知识和经验,然后才能给每个公共因子给出一个实际意义。而且,公共因子的解释,在很大程度上也依赖于因子模型中因子载荷矩阵的元素结构!这个时候就会牵扯出因子分析中其它的一些问题:因子旋转和因子得分。因为这两个问题涉及到一些比较复杂的数学知识,我不能够在清减数学的情况下说好它,如果单说怎么用,我觉得没有必要,所以暂时并不打算介绍这两个问题。有兴趣的,可以翻阅一些多元统计的书籍,一般都会有讲。
转自:http://jackycode.github.io/blog/2014/05/19/factor-analysis2/
- 数据科学之机器学习17:因子分析2
- 数据科学之机器学习16:因子分析1
- 数据科学之机器学习2:线性回归1
- 数据科学之机器学习3:线性回归2
- 数据科学之机器学习11: 聚类分析2
- 数据科学之机器学习1:简介
- 数据科学之机器学习7: 决策树
- 机器学习--因子分析
- 数据科学之机器学习6: 分类之朴素贝叶斯
- 数据科学之机器学习8: 决策树之ID3
- 数据科学之机器学习4:线性回归3
- 数据科学之机器学习10: 聚类分析1
- 数据科学之机器学习12: Logisic回归
- 数据科学之机器学习13: 关联分析
- 数据科学之机器学习15: 主成分分析
- 机器学习:Factor analysis因子分析
- 机器学习:数据驱动的科学
- 机器学习:数据驱动的科学
- 用两个栈实现队列
- Android组件- 广播的静态动态有序无序与优先级
- OGG-01031
- OCP 1Z0 051 66
- Rain24日广州开唱 将用更多中文与粉丝互动
- 数据科学之机器学习17:因子分析2
- burpsuit暴力破解的方法
- 《Cortex™-A系列编程者指南(V3.0)》第12章<异常处理>笔记
- OpenCv Hog+SVM bat批处理
- redis配置文件说明
- mysql 关于range 分区 的认识
- 黑马程序员学习笔记——CounDownLatch、Exchange
- Zoj 3537 Cake (区间DP_最优三角形剖分)
- Linux字符串转换函数 simple_strtoul