Weka源码开发01——初识Weka及其源码开发

来源:互联网 发布:华尔街工资知乎 编辑:程序博客网 时间:2024/05/20 22:39

Weka源码开发01——初识Weka及其源码开发

Weka是一个伟大的工具,这一点估计各位在搜索到本篇文章前已经知道了,Weka源码开发系列,就是希望能在自己的代码中使用Weka的现成算法,毕竟人家是一个开源且强大的软件嘛

  • Weka源码开发01初识Weka及其源码开发
    • 下载Weka软件及其源码
    • 在java工程中使用Wekajar
    • 在非java环境中使用Wekajar
    • 结语


下载Weka软件及其源码

       既然来到了这篇文章,那您一定是搞数据挖掘或机器学习的了。Weka是一款免费的、现今最完备的数据挖掘工具。在Weka官网 http://www.cs.waikato.ac.nz/ml/weka/ 上有对Weka的介绍,翻译如下:

Weka是一些机器学习算法的集合,这些算法既可以直接被用在一个数据集上,又可以在你自己的Java代码中调用。这些算法包括:数据预处理、分类算法、聚类算法、规则提取、关联规则、数据可视化等。
我们提供了在线的免费课程(《Data mining using Weka》),在YouTube(https://www.youtube.com/user/WekaMOOC)上

       最后的那个公开课很好的,是Ian H.Witten大神讲授的,他也是怀卡托大学的一名教授,这门课程的教材也是Ian大神写的叫《Data Mining——Practical Machine Learning Tools and Technology》。如果您不好上YouTube,可以在YouKu(http://i.youku.com/i/UMTI4NTE5OTA0NA==?from=recommend)上看,有新旧两个版本。
       这个介绍已经说明了我们可以在自己的Java工程中使用Weka提供的算法,首先先下载Weka,现在最新的版本是Weka3.8,可以在上面的官网中下载到。本系列博文使用3.6,因为Ian的那本教材就是基于3.6的。

在java工程中使用Weka.jar

安装,打开安装目录,如下图所示:Weka的安装目录

       其中标出来的doc文件夹就是帮助文档,打开其中的index.html就可以查看API开发文档。
       而weka.jar就是我们的主角了,将他导入你的java工程,你就能随心所欲的使用了,至于怎么使用我们后面再说。

在非java环境中使用Weka.jar

       Weka是用java语言开发的,这就是为什么他提供了jar包的原因。可我们搞科研的使用的语言五花八门啊,毕竟实现只是科研路上很小的一步啊。。。这怎么办呢?还好有很多很多的大神也遇到了同样的问题,并孜孜不倦的(可你们为什么不维护呢?大雾)将Weka迁移到其他语言环境(R Python matlab等等),Weka的官网提供了一个完整的,包括所有related project的列表,在http://weka.wikispaces.com/Related+Projects 上。

结语

       至此,所有的准备工作都做完了,在下一篇中,我们将学习使用Weka.jar在程序中读取和存储文件。

0 0