Apache Mahout的KMeans算法测试
来源:互联网 发布:中药软件哪个好使 编辑:程序博客网 时间:2024/05/21 22:44
Mahout是Hadoop中实现数据挖掘的包,虽然现在一般用spark mlib,但是为了做比较,想着将mahout的算法进行验证测试一下。。
Mahout的安装还是非常简单的,只需要解压一下再进行如下配置就可以。
# Mahout
export MAHOUT_HOME=/home/ndscbigdata/soft/mahout-0.11.0
export PATH=$MAHOUT_HOME/bin:$PATH
export CLASSPATH=$CLASSPATH:$MAHOUT_HOME/lib
由于算法有很多博客或者书籍上均有介绍,所以在此就不再重复。
其中Kmeans算法测试采用网上流行的"syntheticcontrol"数据集来实现。而关于这个数据集mahout提供了三种算法,如下所示:
因此进行kmeans测试,其结果如图所示。
对结果进行分析比较,发现基于hadoop的迭代数据挖掘效率还是非常低下的,它每次都要将中间聚类结果存储在DISK中。
0 0
- Apache Mahout的KMeans算法测试
- mahout kmeans 测试
- mahout使用KMeans算法
- Apache mahout中HMM(隐马尔可夫)算法的测试
- mahout kmeans 算法源码解读
- mahout 中聚类算法kmeans案例
- mahout下的Hadoop平台上的Kmeans算法实现
- Mahout架构初探及KMeans算法分布式实现的研究
- Mahout架构初探及KMeans算法分布式实现的研究
- mahout运行测试与数据挖掘算法之聚类分析(一)kmeans算法解析
- Mahout 之kmeans算法学习笔记
- Mahout学习之聚类算法Kmeans
- Mahout-Kmeans
- Mahout kmeans
- Apache Mahout 实现的机器学习算法
- Apache Mahout 实现的机器学习算法
- Apache Mahout 实现的机器学习算法
- Apache Mahout 实现的机器学习算法
- maven 插件findbugs源代码的解析
- 初级数据持有化-沙盒
- zipper dp与dfs poj4710
- 继承hibernateDaoSupport之后通过注解方式注入SessionFactory
- 11用户手册
- Apache Mahout的KMeans算法测试
- Mysql 安装与配置
- 一张图看懂hash的核心思想(我只是从我的角度)
- LeetCode-Climbing Stairs
- 英文论文中“such as, for example, e.g., i.e., etc., et al. ”的用法分析
- Django1.8使用小结
- mysql中的GTID的概念
- 计算机病毒与木马
- KVO--观察者模式