数据降维、PCA——基于鸢尾花数据集
来源:互联网 发布:php小偷程序破解 编辑:程序博客网 时间:2024/05/22 09:51
主成分分析PCA
主成分分析(Principal Component Analysis, PCA)
主成分:
可以把具有相关性的高纬度变量,合成为线性无关的低纬度变量,称为主成分。主成分能够尽可能保留原始数据的信息。
- 方差(度量分散程度)
- 协方差(度量两变量间的线性相关性,0,线性无关)
- 特征向量:描述数据结构的非零向量。
原理:
矩阵的主成分就是其协方差矩阵对应的特征向量,按照对应的特征值大小进行排序,最大的特征值就是第一主成分,其次第二主成分,以此类推。
sklearn库,使用sklearn.decomposition.PCA加载PCA进行降维,主要参数:
- n_components:指定主成分个数,即降维后数据维度。
- svd_solver:特征值分解方法
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from sklearn.datasets import load_iris
data = load_iris()
y = data.target
X = data.data
pca = PCA(n_components=2)
reduced_X = pca.fit_transform(X)
red_x, red_y = [], []
blue_x, blue_y = [], []
green_x, green_y = [], []
for i in range(len(reduced_X)):
if y[i] == 0:
red_x.append(reduced_X[i][0])
red_y.append(reduced_X[i][1])
elif y[i] == 1:
blue_x.append(reduced_X[i][0])
blue_y.append(reduced_X[i][1])
else:
green_x.append(reduced_X[i][0])
green_y.append(reduced_X[i][1])
plt.scatter(red_x, red_y, c='r', marker='x')
plt.scatter(blue_x, blue_y, c='b', marker='D')
plt.scatter(green_x, green_y, c='g', marker='.')
plt.show()
阅读全文
0 0
- 数据降维、PCA——基于鸢尾花数据集
- 鸢尾花数据集—python可视化
- 基于鸢尾花数据的分类分析
- logistic regression 处理鸢尾花数据集
- Iris DataSet 鸢尾花数据集
- 实现鸢尾花数据集分类
- 在R环境下基于鸢尾花数据做聚类分析
- 数据降维(基于PCA)
- 基于IRIS(鸢尾花)数据集使用sklearn的特征工程练习
- 基于几条大神链接的理解,总结数据降维处理——PCA
- PCA数据降维
- 数据降维(pca)
- 数据降维PCA
- ChiMerge 算法: 以鸢尾花数据集为例
- ChiMerge 算法: 以鸢尾花数据集为例
- Google机器学习(二) 鸢尾花数据集 load_iris
- 鸢尾花分类预测数据分析
- 一个分类方法:在降维的同时能增大类别分离度,在手写数字数据集及鸢尾花的图片数据集上做了对比试验
- JS开发中的一些小技巧和方法
- WPF利用委托与事件实现VM对View中控件的调用
- caffe编译
- 轮播插件
- go编程:浅析go程序初始化顺序
- 数据降维、PCA——基于鸢尾花数据集
- Nginx相关配置简单说明
- Linux发行版安装软件选择:编译、软件包or容器?
- 单例类
- 如何免费获取windows10开发者账户(个人)
- 简单的makefile例子
- 微信公众号开发--服务器配置(傻瓜入门教程)
- Vim的分屏功能
- 2017年秋季招生文案/活动