读取txt,分类训练集和测试集
来源:互联网 发布:手机日历软件 编辑:程序博客网 时间:2024/05/21 21:50
1.采用sklearn.model_selection模块中的train_test_split对数据集进行分类,其中test_size是小数表示样品比例,设置整数则是代表测试集个数,
可设置random_state,它是随机数的种子,不同的种子会造成不同的随机采样结果,相同的种子采样结果相同。
2.使用np中loadtxt读取txt文件,文件保存格式为ASCI编码,UTF编码需备注encoding=’ ‘,其中r使python正常读入“\”,否则文件名中用“/”代替
3.np中可采用tolist()函数直接将ndarray转换成list
4.将数据集中属性和标签分开,采用zip()函数整合,合成list
import numpy as npfrom sklearn.model_selection import train_test_splitdef load_data(): data = np.loadtxt(r'F:\net\spambase\spambase.txt',delimiter = ',') training_data, test_data = train_test_split(data,test_size=0.2) # training_data = training.tolist() # test_data = test.tolist() return (training_data,test_data)def load_data_wrapper(): tr_d, te_d = load_data() training_inputs = [np.reshape(x, (57, 1)) for x in tr_d[:,0:57]] training_results = [vectorized_result(y) for y in tr_d[:,-1]] training_data = list(zip(training_inputs, training_results)) test_inputs = [np.reshape(x, (57, 1)) for x in te_d[:,0:57]] test_results = [y for y in te_d[:,-1]] test_data = list(zip(test_inputs, test_results)) return (training_data, test_data)def vectorized_result(j): e = np.zeros((2, 1)) i = int(j) e[i] = 1.0 return e
阅读全文
0 0
- 读取txt,分类训练集和测试集
- Mnist数据集下载、转换为lmdb,训练、测试、生成mean文件、生成label.txt、单张图片分类测试、可视化网络、可视化loss和accurate
- matlab制作caffe训练集和测试集的标签文件tran.txt val.txt
- Caffe读取训练和测试日志
- 训练集、测试集和验证集 训练集
- 训练集,测试集和验证集
- 训练集,验证集和测试集
- Python分割训练集和测试集
- 训练集和测试集的划分
- 训练和测试自己的图像集
- lucene测试IKAnalyzer分词器和读取txt文件方法
- 深度【文本分类】【关系抽取】模型中,如何读取并处理输出的训练文件(TXT格式)
- 提取训练,测试集
- SVM分类和训练
- 1.1 图像分类:数据驱动的方法,k-近邻,划分训练集/验证集/测试集
- Windows下mnist数据集caffemodel分类模型训练及测试
- 【pytorch】训练集的读取
- [转]训练集和测试集的含义和区别?
- HDU
- 网络攻防——黛蛇蠕虫病毒
- odoo10普通视图添加自定义css和自定义js
- 自制人物卡片轮播组件,自动轮播,点击切换
- 解密长沙矿工挖矿软件抽水图文教程
- 读取txt,分类训练集和测试集
- CKG10-高性能高可用Yii2.0电商平台 仿京东商城 高级组件 MySQL LVS
- java的mvc模式
- 第十二周 项目(5)
- Spark RDD知识点汇总
- Codeforces Round #447 (Div. 2) C. Marco and GCD Sequence 构造
- yaf--Hello World
- 一维卷积详细解释
- Java NIO初探(一)