Python:从UCI数据库下载数据集到内存

来源:互联网 发布:苹果cms收费采集 编辑:程序博客网 时间:2024/06/05 11:33

import numpy as np
import urllib

指定文件的URL

url = “http://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/pima-indians-diabetes.data”
raw_data = urllib.urlopen(url)
dataset = np.loadtxt(raw_data, delimiter=”,”)

分割数据集

X = dataset[:,0:7]#特征矩阵
y = dataset[:,8] #样本类别