Mahout介绍
来源:互联网 发布:厦门蓝象网络骗局 编辑:程序博客网 时间:2024/05/22 15:47
What is Mahout, why need it?
Mahout 是机器学习和数据挖掘的一个分布式框架,区别于其他的开源数据挖掘软件,它是基于hadoop之上的; 所以Mahout的优势就是hadoop的优势。官网http://mahout.apache.org/ 上说的Scalable就是指hadoop的可扩展性。
Mahout用map-reduce实现了部分数据挖掘算法,解决了并行挖掘的问题。这里说的“解决”是一个初步的概念,很多算法由于各种原因是无法用map-reduce并行实现的。
Supported Algorithms
Classification
Logistic Regression(SGD)
Bayesian
Support Vector Machines(SVM)
Perceptron and Winnow
Neural Network
Random Forests
Restricted Boltzmann Machines
Online Passive Aggressive
Boosting
Hidden Markov Models
Clustering
Canopy Clustering
K-Means Clustering
Fuzzy K-Means
Expectation Maximization (EM)
Mean Shift Clustering
Hierarchical Clustering
Dirichlet Process Clustering
Latent Dirichlet Allocation
Spectral Clustering
Minhash Clustering
Top Down Clustering
Pattern Mining
Parallel FP Growth Algorithm
Dimension reduction
Singular Value Decomposition and other Dimension Reduction Techniques
Stochastic Singular Value Decomposition with PCA workflow
Principal Components Analysis
Independent Component Analysis
Gaussian Discriminative Analysis
Recommenders / Collaborative Filtering
Non-distributed recommenders ("Taste")
Distributed Item-Based Collaborative Filtering
Collaborative Filtering using a parallel matrix factorization
Install and use
下载Mahout(http://www.apache.org/dyn/closer.cgi/mahout/ ), 解压;
在MAHOUT_HOME/bin目录下,在mahout中添加:
export JAVA_HOME=XXXX
export HADOOP_HOME=XXXX
export HADOOP_CONF_DIR=XXXX
HADOOP_CONF_DIR如果没设置,会默认为HADOOP_HOME/conf
编译:MAHOUT_HOME目录下,执行mvn clean && mvn compile && mvn -DskipTests install
好了, 提示SUCCESS则OK
how to use
在MAHOUT_HOME/bin目录下,执行./mahout --help 可以看到mahout目前拥有的算法
也可以在MAHOUT_HOME/src/conf/driver.classes.props文件中查看各个算法的入口,如果要添加新的算法,也可以在这个文件中注册。
算法的执行:
例如执行贝叶斯分类 (训练过程)
MAHOUT_HOME/bin目录下 执行./mahout trainclassifier -h 查看参数
reference
参考https://cwiki.apache.org/MAHOUT/quickstart.html
- Mahout介绍
- mahout介绍
- mahout 介绍
- Mahout介绍
- Mahout介绍
- Mahout介绍
- mahout推荐介绍-3
- mahout推荐介绍-2
- mahout介绍-1
- Mahout推荐引擎介绍
- Mahout分布式推荐引擎介绍
- Mahout命令使用参数介绍
- Mahout中相似度计算方法介绍
- Mahout中相似度计算方法介绍
- Mahout下个性化推荐引擎Taste介绍
- Mahout下个性化推荐引擎Taste介绍
- mahout 推荐引擎的相关介绍
- Mahout中相似度计算方法介绍
- hive基础
- Linux信号(signal) 机制分析
- PopUpAnchor control
- 程序员妻子自述:那些程序员教给我的
- [COM/ATL]COM组件编程——初步了解
- Mahout介绍
- Ajax的基本运作方式
- 10047 - The Monocycle//bfs
- POJ1279(求多边形内核的面积)
- 三层架构初涉
- linux进程间通信之信号量(semaphore)
- Android 自定义Adapter动态更新ListView视图
- 2.struts2 数据库里取数据
- 01 初识STRUTS2