Mahout0.9—Hadoop2.20—FPG关联规则算法
来源:互联网 发布:金庸 古龙 知乎 编辑:程序博客网 时间:2024/05/18 03:37
1. Mahout0.9—Hadoop2.20—FPG关联规则算法
1.1. FPG函数
目前Mahout0.9 无fpg函数,0.9之前版本有,但是在0.9中可以找到fpg的jar包;mahout org.apache.mahout.fpm.pfpgrowth.FPGrowthDriver 等价于 fpg;
1) fpg参数(mahout org.apache.mahout.fpm.pfpgrowth.FPGrowthDriver)
-- minSupport,最小支持度,默认3
-- maxHeapSize,最大项集,默认50
-- numGroups,分组数量
-- splitterPattern,数据分割符,如:" \"[ ,\\t]*[,|\\t][ ,\\t]*\" ", "[ ,\t]*[,|\t][ ,\t]*"
-- numTreeCacheEntries,fpg树数量,Values: [5-10]", 默认"5"
-- method,sequential|mapreduce,并行或者串行计算;
-- encoding,编码,Default value: UTF-8", "UTF-8"
-- useFPG2,"2", "Use an alternate FPG implementation"
1.2 FPG挖掘
#上传数据
sudo hadoop fs -put ./ retail.dat /user/input
# 1、FPG命令sudo mahout fpg -i /user/input/retail.dat -o /user/output -method mapreduce -s 200 -regex '[ ]' –k 20
# 1、FPG命令(Mahout0.9)
sudo mahout mahout org.apache.mahout.fpm.pfpgrowth.FPGrowthDriver -i /user/input2/retail.dat -o /user/output -method mapreduce -s 200 -regex '[ ]' –k 20
# 2、输出结果文件查看:
sudo mahout seqdumper -i /user/output/fpgrowth/part-r-00000
转载请注明出处:
http://blog.csdn.net/sunbow0/article/details/41962141
0 0
- Mahout0.9—Hadoop2.20—FPG关联规则算法
- Mahout0.9—Hadoop2.20—协同过滤算法
- Mahout0.9 ——hadoop2.2.0编译与安装
- hadoop2.2+mahout0.9实战
- hadoop2.2+mahout0.9实战
- hadoop2.2+mahout0.9问题
- Mahout0.9安装(Hadoop2.6.0)
- mahout0.9 hadoop2.x 编译
- 关联规则挖掘——Apriori算法
- 关联规则——FP-Tree算法
- 关联规则——FP Growth算法
- 关联规则挖掘——Apriori算法
- 关联规则挖掘的算法——Apriori算法
- 数据挖掘算法——关联规则挖掘算法
- 【数据挖掘算法】关联规则——Fp-tree算法
- 【ML算法】关联规则——Apriori算法
- mahout0.9 hadoop2.4.1 编译错误 math-scala wrappers
- 关联规则挖掘技术——主流推荐算法评述
- 双拼top域名释义能力强、使用范围广
- Android Overlay机制简述
- mybatis实战教程(mybatis in action)之七:实现mybatis分页(源码下载)
- [Android实例] android 获得一个应用程序的启动次数,运行时间等信息
- 人生是一场相逢,人生又是一场遗忘
- Mahout0.9—Hadoop2.20—FPG关联规则算法
- ListView详解
- 第16周项目4-为动态数组扩容
- Unity中NGUI点击事件委托的应用
- 计算半径
- ZigZag Conversion
- 我的第一篇
- 简单编程(二十)将奇数和偶数分别存入到两个不同的数组中,并按奇数、偶数交替的顺序输出
- 有关phpmyadmin无法打开index.php,只能打开目录的问题