weka数据集预处理
来源:互联网 发布:各个国家域名的缩写 编辑:程序博客网 时间:2024/05/14 15:08
1. 利用有监督的离散算法对数据集的属性进行离散,并保存离散后的数据集;
import java.io.File;
import weka.filters.SupervisedFilter;import java.io.IOException;
import weka.core.Instances;
import weka.core.converters.CSVLoader;
import weka.core.converters.ConverterUtils.DataSink;
import weka.core.converters.ConverterUtils.DataSource;
import weka.filters.*;
import weka.filters.supervised.attribute.Discretize;
//unsupervised
import weka.filters.unsupervised.attribute.AddID;
public class preprocess {
/**
* @param args
* @throws Exception
*/
public static void main(String[] args) throws Exception {
// TODO Auto-generated method stub
Instances instances = DataSource.read("C:/Users/PC/Desktop/segment-challenge.arff");
instances.setClassIndex(instances.numAttributes() - 1);
Discretize discretize = new Discretize();
System.err.println(instances.toSummaryString());
AddID filter = new AddID();
String[] options = new String[6];
options[0] = "-B";
options[1] = "8";
options[2] = "-M";
options[3] = "-1.0";
options[4] = "-R";
options[5] = "2-last";
discretize.setOptions(options);
discretize.setInputFormat(instances);
Instances newInstances2 = Filter.useFilter(instances, discretize);
System.err.println(newInstances2.toSummaryString());
DataSink.write("data/1.arff", newInstances2);
}
}
2 利用weka中的算法对segment-challenge.arff数据集进行标准化处理,并保存标准化后的数据集
import java.io.File;
import weka.filters.SupervisedFilter;
import java.io.IOException;
import weka.core.Instances;
import weka.core.converters.CSVLoader;
import weka.core.converters.ConverterUtils.DataSink;
import weka.core.converters.ConverterUtils.DataSource;
import weka.filters.*;
import weka.filters.unsupervised.attribute.*;
//unsupervised
import weka.filters.unsupervised.attribute.AddID;
public class preprocess {
/**
* @param args
* @throws Exception
*/
public static void main(String[] args) throws Exception {
// TODO Auto-generated method stub
Instances instances = DataSource.read("C:/Users/PC/Desktop/segment-challenge.arff");
instances.setClassIndex(instances.numAttributes() - 1);
Normalize normalize = new Normalize ();
System.err.println(instances.toSummaryString());
String[] options = new String[6];
options[0] = "-B";
options[1] = "8";
options[2] = "-M";
options[3] = "-1.0";
options[4] = "-R";
options[5] = "2-last";
normalize.setOptions(options);
normalize.setInputFormat(instances);
Instances newInstances2 = Filter.useFilter(instances, normalize);
System.err.println(newInstances2.toSummaryString());
DataSink.write("C:/Users/PC/Desktop/2.arff", newInstances2);
}
}
http://blog.sina.com.cn/s/blog_6f611c30010185kz.html
http://blog.163.com/shen_960124/blog/static/60730984201502884651349/
- weka数据集预处理
- weka中的数据预处理
- weka进行数据预处理
- weka---数据预处理
- Weka学习2-数据预处理
- weka数据挖掘之预处理
- 数据预处理和weka.filters的使用
- 使用Weka进行数据挖掘(Weka教程五)Weka数据预处理之Filter使用
- weka数据预处理:使用weka将excel数据转换为arff格式数据
- weka数据集下载
- 数据预处理和weka.filters的使用--数据挖掘学习和weka使用(三)
- 数据预处理和weka.filters的使用--数据挖掘学习和weka使用
- 通过weka.jar包来进行数据预处理
- 通过weka.jar包来进行数据预处理
- Weka训练数据集.arff大合集
- 用weka打开UCI数据集
- Weka介绍--使用Weka进行数据挖掘
- Weka数据挖掘
- ExtJs6 combo下拉框分页、提示、换行提示等增强功能
- 数据结构实验之栈六:下一较大值(二)
- 移动终端引用字体 font-face CSS3
- Magic Leap:混合现实代表着未来
- mobiscroll calendar插件
- weka数据集预处理
- mobiscroll 自定义dialog
- mobiscroll select 弹出指定内容
- charCodeAt、parseInt、number.toString(num),fromCharCode方法实现加密、解密
- scrapy 学习之路
- vmware 两个虚拟网卡的说明
- Mysql提示you need the SUPER privilege for this operation的解决办法
- C#连接mysql数据库 及向表中插入数据的方法
- bootstrap tooltips控件学习