使用Weka进行数据挖掘学习入门

来源:互联网 发布:河正宇电影知乎 编辑:程序博客网 时间:2024/05/16 16:04

入门:

Weka官网 :Weka安装目录下有Documentation,Wiki,Manual等。有一本官方的书。

Coursera有一门课。

使用Weka时,在构建模型的时候,如果数据量比较大,经常会遇到下面两个错误,查看Log会看到。
java.lang.OutOfMemoryError:GC overhead limit exceeded
java.lang.OutOfMemoryError: Java heap space
解决办法:启动Weka的时候加参数
java -XX:-UseGCOverheadLimit -Xmx1024m -jar weka.jar

有关博客:

Weka学习笔记:很多Java纯代码。绝对要看。总共有53篇博客,简单易懂。

Weka开发:纯天然手撕Weka代码,一堆源码分析,这个也必须看。

使用Weka命令行实现了一个文本分类:很详细(另外 Java代码版本)

使用Weka的一个例子:

  1. 数据挖掘简述和weka介绍–数据挖掘学习和weka使用(一)
  2. 输入数据与ARFF文件–数据挖掘学习和weka使用(二)
  3. 数据预处理和weka.filters的使用–数据挖掘学习和weka使用(三)
  4. OneR算法和weka中OneR使用–数据挖掘学习和weka使用(四)
  5. RIpple-DOwn Rule算法和weka中Rider使用–数据挖掘学习和weka使用(五)

Online Resources & Reference Material:DePaul University的Web Data Mining
for Business Intelligence课程资料

Weka各类分类器的使用(Java)

Weka中Kappa是什么鬼

特征降维实例(Java),另外介绍特征降维的各种类

0 0