数据挖掘算法学习(四)PCA算法
来源:互联网 发布:手机啤酒软件 编辑:程序博客网 时间:2024/06/10 17:28
转载请附上链接http://blog.csdn.net/iemyxie/article/details/38236647
算法简介
主成分分析(PrincipalComponentAnalysis,简称PCA)是一种常用的基于变量协方差矩阵对信息进行处理、压缩和抽提的有效方法。主要用于对特征进行降维。
算法假设
数据的概率分布满足高斯分布或是指数型的概率分布。方差高的向量视为主元。
算法输入
包含n条记录的数据集
算法输出
降维或压缩后的数据集
算法思想
•1.计算所有样本的均值m和协方差矩阵S;
•2.计算S的特征值,并由大到小排序;
•3.选择前n'个特征值对应的特征矢量作成一个变换矩阵E=[e1,e2, …, en’];
•4.最后,对于之前每一个n维的特征矢量x可以转换为n’维的新特征矢量
y=transpose(E)(x-m)
weka运行结果
以weather.nominal.arff为例运行结果部分截图如下:
算法应用
人脸识别
图像压缩
信号去噪
转载请附上链接http://blog.csdn.net/iemyxie/article/details/38236647
0 0
- 数据挖掘算法学习(四)PCA算法
- 数据挖掘算法学习(四)PCA算法
- 数据挖掘算法(四)--线性回归
- 【数据挖掘】算法学习笔记
- 机器学习&数据挖掘算法
- 【数据挖掘算法】KNN学习
- 数据挖掘算法学习(一)K-Means算法
- 数据挖掘算法学习(三)NaiveBayes算法
- 数据挖掘算法学习(五)C4.5算法
- 数据挖掘算法学习(六)CART算法
- 数据挖掘算法学习(七)SVM算法
- 数据挖掘算法学习(八)Adaboost算法
- 数据挖掘算法学习(一)K-Means算法
- 数据挖掘算法学习(三)NaiveBayes算法
- 数据挖掘算法学习(八)Adaboost算法
- 数据挖掘算法学习之Apriori算法
- 数据挖掘系列(四)聚类算法评价指标
- 数据挖掘四类问题算法归纳
- pthread_cond_signal与pthread_cond_wait详解
- U盘安装Ubuntu系统[Errno 5] Input/output error
- 第七章 tcp发送(传输层)--基于Linux3.10
- java中的Collection
- Android 一个绚丽的loading动效分析与实现!
- 数据挖掘算法学习(四)PCA算法
- 106-最全的常用正则表达式大全——包括校验数字、字符、一些特殊的需求等等
- Listview控件使用SimpleAdapter适配器实现屏幕下滑增加一个item选项以及用到的方法总结
- RFID第三周课程作业
- Java中整数问题及整数转换为二进制总结
- 108-Yosemite 10.10安装盘 U 盘制作教程
- C++ New崩溃原理及解决方法
- [百度]数组A中任意两个相邻元素大小相差1,在其中查找某个数。
- 《BING: Binarized Normed Gradients for Objectness Estimation at 300fps》读后感~