数据挖掘工具Weka之数据格式ARFF及CSV文件格式转换
来源:互联网 发布:网络电视无线路由器 编辑:程序博客网 时间:2024/05/29 17:08
Weka介绍:
Weka是一个用Java编写的数据挖掘工具,能够运行在各种平台上。它不仅提供了可以直接用于数据挖掘的软件,还提供了src代码,使用者可以修改源代码,进行二次开发。但是,由于其使用了Java虚拟机,导致其不适合处理大型数据,运行缓慢。处理超过一定大小数据,还会溢出heap size,使程序崩溃。但作为初学者,很适合通过处理一些小型数据集,以直观地了解各种数据挖掘方法。它还自带一些典型的数据集,可以直接使用。在安装目录下的data子目录中。
Weka通常使用ARFF文件格式的文件。也可以直接使用CSV文件格式的文件,但与传统CSV文件不同,Weka能识别的CSV文件要求第一行给各列的定义。因为CSV文件比较容易获得,excel表格文件可以直接另存为csv文件。推荐使用csv文件。
以著名数据挖掘数据集鸢尾花为例,该数据集对应的iris.csv文件应如下图所示:
sepal-length,sepal-width,petal-length,petal-width,class5.1,3.5,1.4,0.2,Iris-setosa4.9,3.0,1.4,0.2,Iris-setosa4.7,3.2,1.3,0.2,Iris-setosa4.6,3.1,1.5,0.2,Iris-setosa
打开Weka的Explorer界面,在preprocess->open file打开iris.csv,通过save可以将CSV文件另存为ARFF文件。格式如下图所示:
@relation iris@attribute sepal-length numeric@attribute sepal-width numeric@attribute petal-length numeric@attribute petal-width numeric@attribute class {Iris-setosa,Iris-versicolor,Iris-virginica}@data5.1,3.5,1.4,0.2,Iris-setosa4.9,3,1.4,0.2,Iris-setosa4.7,3.2,1.3,0.2,Iris-setosa4.6,3.1,1.5,0.2,Iris-setosa
- 数据挖掘工具Weka之数据格式ARFF及CSV文件格式转换
- 使用Weka进行数据挖掘(Weka教程二)Weka数据之ARFF与多文件格式转换
- .mat,.txt,.csv 数据转换为weka中的arff格式及matlab和Weka之间相互转换格式
- 数据预处理--数据格式csv、arff等之间的转换
- weka CSV to ARff
- java调用weka,读取csv及arff文件,将csv转化为arff文件
- 数据挖掘工具weka使用
- weka数据预处理:使用weka将excel数据转换为arff格式数据
- weka arff稀疏数据写法
- weka中的arff格式数据
- Weka学习之ARFF文件
- weka数据挖掘之预处理
- 数据挖掘工具weka中的算法列表
- weka: 生成并保存ARFF格式数据
- Weka训练数据集.arff大合集
- [WEKA]如何将英文文本数据集转换为ARFF格式
- weka怎么把csv文件转化成arff文件
- 利用数据挖掘工具weka进行管理规则挖掘
- SQL server 2008 关于XML类型数据 功能总结及性能测试
- IPHONE数据存储的常用方式NSKEYEDARCHIVER/NSUSERDEFAULTS/PLIST WRITE写入
- poj 2229 dp
- 网络攻击--ARP攻击
- shell讲解--awk
- 数据挖掘工具Weka之数据格式ARFF及CSV文件格式转换
- The Coldest Place On Earth——Chapter 1 Two Ships
- JAVA WEB应用下监听与定时器的配合使用
- android游戏开发框架libgdx的使用-环境搭建
- javaScript中的call的用法
- 网站系统分布式架构
- ubuntu12.04下解决gedit显示乱码的问题
- Struts2 标签库讲解
- Android ScrollView用法