PCA方法及其应用
来源:互联网 发布:linux查看hadoop版本 编辑:程序博客网 时间:2024/06/06 16:18
主成分分析(Principal Component Analysis, PCA)是最常用的一种降维方法,通常用于高维数据集的探索和可视化,还可以用作数据压缩和预处理等。
PCA可以把具有相关性的高维变量合成为线性无关的低维变量,称为主成分。主成分能够尽可能保留原始数据的信息。
主成分分析相关术语:
方差、协方差、协方差矩阵、特征向量和特征值
原理:矩阵的主成分就是其协方差对应 特征向量,按照的特征值大小进行排序,最就是第一主成分其次二成分,以此类推。
主成分分析-算法过程
sklearn中主成分分析
在sklearn中,可以使用sklearn.decomposition.PCA加载PCA进行降维,主要参数有:
n_components:指定主成分的个数,即降维后数据的维度
svd_solver: 设置特征值分解的方法,默认为’auto’,其他可选有’full’,’arpack’,’randomized’
import matplotlib.pyplot as pltfrom sklearn.decomposition import PCAfrom sklearn.datasets import load_irisdata = load_iris()y = data.targetX = data.datapca = PCA(n_components=2)reduced_X = pca.fit_transform(X)red_x, red_y = [], []blue_x, blue_y = [], []green_x, green_y = [], []for i in range(len(reduced_X)): if y[i] == 0: red_x.append(reduced_X[i][0]) red_y.append(reduced_X[i][1]) elif y[i] == 1: blue_x.append(reduced_X[i][0]) blue_y.append(reduced_X[i][1]) else: green_x.append(reduced_X[i][0]) green_y.append(reduced_X[i][1])plt.scatter(red_x, red_y, c='r', marker='x')plt.scatter(blue_x, blue_y, c='b', marker='D')plt.scatter(green_x, green_y, c='g', marker='.')plt.show()
可以看出,降维后的数 据仍能够清晰地分成三类。这样不仅能削减数据的维度,降低分类任务的工作量,还能保证分类的质量。
阅读全文
0 0
- PCA 方法及其应用
- PCA方法及其应用
- 5. PCA方法及其应用
- PCA算法及其应用
- Python机器学习应用 | 降维——PCA方法及其应用
- PCA算法及其应用(代码)
- PCA方法的应用场景
- PCA算法及其在人脸识别上的应用
- PCA 原理及其在图像压缩中的应用
- PCA应用
- PCA代码及其注释
- 图像组训练过程的PCA和LDA应用方法
- 贝叶斯方法及其应用(1)
- 贝叶斯方法及其应用(2)
- 4. DBSCAN方法及其应用
- PDO常用方法及其应用
- PCA算法及其数学原理
- PCA降维及其实现
- TCP/IP 四层协议
- 让人失望透顶的 CSDN 博客改版
- Mac环境下svn的使用
- win32菜单练习复习
- ReactNative 项目实战 (2) ListView 使用 网络请求以及下拉刷新 (条目控件封装)
- PCA方法及其应用
- 【9月16日】中文信息MMT模型
- 关于 apply,call 和 bind 的理解
- Inteillj IDEA Web项目配置
- java中String和int 的转换
- 剑指offer--(4) 重建二叉树
- 词向量源码解析:(5.8)ngram2vec源码解析之counts2ppmi等
- robotframework ‘ascii’ codec can’t decode byte 0xe6 in position 977
- 内存地址空间布局