Mahout中分布式bayes实现(转)
来源:互联网 发布:mpp文件用什么打开mac 编辑:程序博客网 时间:2024/06/14 08:53
Mahout中的bayes实现分为三部分,
1. 样本构建; 通过org.apache.mahout.classifier.BayesFileFormatter来实现,它将一组文件转换成label\t term1 term2 term3 …这样的格式,供后面分类器构造和分类时使用; 代码分析在前几篇博文中提供了;
2. 训练; 通过org.apache.mahout.classifier.bayes.TrainClassifier实现,它会调用BayesDriver来构建的map reduce类,它们会生成Bayes中间的参数信息,供分类时使用;
3. 测试分类; 通过 org.apach.mahout.classifier.bayes.TestClassifier 实现,它分为串行执行和并行执行两种; 这部分分类前要先调用org.apache.mahout.classifier.bayes.datastore中的一个DataStore类型,由于笔者对于HBase不了解,所以会在后面介绍InMemoryBayesDatastore这个类,它会在分类前被初始化,初始化的对象中保存了在第二步得到的中间参数信息。
BayesFileFormatter源码注释:http://anqiang1900.blog.163.com/blog/static/11418886420103252411298/
BayesFeatureMapper:http://anqiang1900.blog.163.com/blog/static/11418886420103643818519/
BayesTfIdfMapper:http://anqiang1900.blog.163.com/blog/static/11418886420103644331747/
BayesWeightSummerMapper:http://anqiang1900.blog.163.com/blog/static/11418886420103644648280/
- Mahout中分布式bayes实现(转)
- Mahout中分布式bayes实现-转
- mahout中naive bayes测试实现
- mahout中naive bayes分类模型实现过程
- mahout中bayes分类分析—1
- mahout-0.6中naive bayes训练过程
- mahout bayes中数据划分源码分析
- Mahout之bayes算法学习(一)
- Mahout之bayes算法学习(二)
- Mahout之bayes算法学习(三)
- Mahout之bayes算法学习(四)
- 实现mahout0.9 bayes 预测功能(mahout只有trainnb和testnb)
- Mahout分类算法学习之实现Naive Bayes分类示例
- Mahout bayes分类器
- Mahout Bayes分类
- hadoop下mahout bayes(贝叶斯)算法研究(1)
- hadoop下mahout bayes(贝叶斯)算法研究(2)
- hadoop下mahout bayes(贝叶斯)算法研究(1)
- Android 之 zygote 与进程创建
- web 开发工具整理
- 太阳在那里?月娘在那里?(关于LBS 的技术乱谈)
- Infragistics NetAdvantage 介绍
- 840个日语惯用句型 学习笔记~10
- Mahout中分布式bayes实现(转)
- [转载]android 软键盘弹出时的界面控制
- android技术博客汇总
- Easymock的andAnswer和andDelegate方法详解
- 嵌入式开发blog url
- main cannot be resolved or is not a field
- 使用mahout实现内容分类(转)
- oralce 中 blob类型的存储
- Keil RTX最小系统在STM32F10x上的实现