Python获取sklearn库中iris数据写入本地csv文件,可视化展示数据并进行分类、聚类实验以及结果可视化
来源:互联网 发布:天猫可以用淘宝助理吗 编辑:程序博客网 时间:2024/05/16 17:45
今天有点时间就找来了iris数据实验了一下,就是可视化绘图感觉很好玩,就拿这个数据集做了一个实验,下面是简单的实验流程
1.获取iris数据写入本地csv文件,实现如下:
def write_iris_data2csv(csvpath='result/show/iris_data.csv'): ''' 读取sklearn库中的iris数据写入到csv文件中 ''' iris=load_iris() data=iris['data'] target=iris['target'].tolist() myfile=open(csvpath, 'wb') mywriter=csv.writer(myfile) mywriter.writerow(['Sepal.Length', 'Sepal.Width', 'Petal.Length', 'Petal.Width', 'Species']) for one_list in data.tolist(): one_list.append(target.pop(0)) mywriter.writerow(one_list) myfile.close()
数据结果截图如下:
2.绘制iris数据的散点图,iris数据通过打印可以看到一共是150个样本数据,每个样本数据包括4个特征,这里采用的方法是使用第一列数据作为x坐标,采用第二列数据作为y坐标来绘制iris数据的散点图,实现如下:
def draw_iris_data(csvpath='result/show/iris_data.csv', savepath='result/show/iris_data.png'): ''' 绘制iris数据的散点图 ''' x_list=[] y_list=[] csv_reader=csv.reader(open(csvpath)) for one_line in csv_reader: print one_line if one_line[0]!='Sepal.Length': x_list.append(one_line[0]) y_list.append(one_line[1]) plt.xlabel('sepal-length') plt.ylabel('sepal-width') plt.title("iris_data_pic") plt.scatter(x_list,y_list,c='g',marker='x') plt.legend('x1') plt.savefig(savepath)
结果如下:
3.使用sklearn封装好的决策树模型来对iris数据集进行分类,我们都知道iris数据集中一共是三个类别的花,每个类别样本数均为50,下面是具体实现:
def DT_iris_data(savepath, csvpath='result/show/iris_data.csv'): ''' 决策树分析iris数据 ''' x_list=[] y_list=[] data_list=[] label_list=[] csv_reader=csv.reader(open(csvpath)) for one_line in csv_reader: if one_line[0]!='Sepal.Length': x_list.append(one_line[0]) y_list.append(one_line[1]) label_list.append(one_line.pop()) data_list.append(one_line) model=DecisionTreeClassifier() model.fit(data_list, label_list) predicted=model.predict(data_list) plt.legend('x1') plt.xlabel('sepal-length') plt.ylabel('sepal-width') plt.title("DT_iris_data_analysis_pic") plt.scatter(x_list, y_list, c=predicted, marker='o') pl.savefig(savepath)
结果如下:
4.使用sklearn库中的Kmeans对iris数据进行聚类处理,结果一共是三个类别,下面是具体实现:
def Kmeans_iris_data(savepath, csvpath='result/show/iris_data.csv'): ''' Kmeans分析iris数据 ''' x_list=[] y_list=[] data_list=[] label_list=[] csv_reader=csv.reader(open(csvpath)) for one_line in csv_reader: if one_line[0]!='Sepal.Length': x_list.append(one_line[0]) y_list.append(one_line[1]) label_list.append(one_line.pop()) data_list.append(one_line) model=KMeans(n_clusters=3) model.fit(data_list, label_list) predicted=model.predict(data_list) print 'predicted' print predicted plt.xlabel('sepal-length') plt.ylabel('sepal-width') plt.title("KMeans_iris_data_analysis_pic") plt.scatter(x_list, y_list, c=predicted, marker='o') pl.savefig(savepath)
结果如下:
简单的小实验,sklearn还有很多很多的机器学习模型可以用于分类和聚类实验,感兴趣的话可以都一一尝试一下,欢迎交流
阅读全文
0 0
- Python获取sklearn库中iris数据写入本地csv文件,可视化展示数据并进行分类、聚类实验以及结果可视化
- 使用python将csv文件数据可视化
- python数据可视化--散点图以及分类
- 读书笔记--python数据可视化--001_读取CSV文件数据
- Iris数据集可视化分析
- iris数据集的可视化
- 【数据可视化】数据可视化分类
- caffe:利用python分类,并可视化模型参数、数据
- caffe:利用python分类,并可视化模型参数、数据
- 使用不同的SVM对iris数据集进行分类并绘出结果
- java将float数据写入csv 并在python中读取csv文件
- Python机器学习库sklearn几种分类算法建模可视化(实验)
- 数据分类可视化matlab
- 在Python中对MySQL中的数据进行可视化
- 在Python中对MySQL中的数据进行可视化
- 如何使用R进行数据展现?且看使用iris数据可视化实例
- 利用 ELK系统分析Nginx日志并对数据进行可视化展示
- 利用 ELK系统分析Nginx日志并对数据进行可视化展示
- sizeof和strlen的区别
- git 提交代码到github上
- Bailian3255 十进制到六进制【进制】
- Caused by: com.sun.org.apache.xerces.internal.impl.io.MalformedByteSequenceException: 3 字节的 UTF-8 序列
- C 结构体内存对齐原则
- Python获取sklearn库中iris数据写入本地csv文件,可视化展示数据并进行分类、聚类实验以及结果可视化
- HTTP Header 详解
- 二维数组中的查找
- 自己动手写strcat函数
- Eclipse导入项目:No projects are found to import
- JMeter性能测试图形化HTML报告
- 数据库设计(有实例)
- 来自 Google 的 R 语言编码风格指南
- 吴恩达深度学习课程deeplearning.ai课程作业:Class 1 Week 2 assignment2_1