mahout相关学习--2

来源:互联网 发布:教学白板软件 编辑:程序博客网 时间:2024/06/07 13:38

1、在创建mahout的测试MR工程时,将mahout-core-job.jar放在了hadoop下面,导致hadoop启动之后会全部死掉,至于为何还不清楚

这个问题很奇怪,我将0.9的包放进去便不会死。

我将0.9的包放到测试MR工程,程序也不会报错,现在看来应该是检测到版本的不匹配问题 。

2、TestBuildTree测试mahout的建树,生成的树很奇怪。估计还是数据描述的问题

现在的一个问题是数据描述,dataset究竟是什么样子的不清楚

3、DescribeFollow测试Describe的一个小问题,关于hdfs地址的问题

4、在一个类里可以调用另一个类的main函数

5、myeclipse如何调试

6、myeclipse断点不能用

7、Describe类里的主要操作是runTool()方法,该方法总共做了四件事:

(1)是一个转换,用glass.data来说是将 [ I, 9, N, L ] 转换成 "I N N N N N N N N N L"

(2)验证输出路径是否存在?

(3)返回一个dataset,该dataset有属性,有标识,有样本数

(4)将dataset写入文件

总的来说这个类的主要作用是将原始文件的描述写入一个文件。

8、困惑。BuildForest中runjob究竟做什么?在配置工作之后fansy直接看了Step1Mapper

9、分析Step1Mapper的setup()

10、Step1Mapper的仿制代码需要都文件的包

0 0
原创粉丝点击