Mahout学习之运行canopy算法错误及解决办法
来源:互联网 发布:电脑钢琴软件 多键 编辑:程序博客网 时间:2024/06/11 16:42
一:将Text转换成Vector序列文件时
在Hadoop中运行编译打包好的jar程序,可能会报下面的错误:
书中和网上给的解决办法都是:把Mahout根目录下的相应的jar包复制到Hadoop根目录下的lib文件夹下,同时重启Hadoop
- Exception in thread "main" java.lang.NoClassDefFoundError:
- org/apache/mahout/common/AbstractJob
但是到了小编这里不管怎么尝试,都不能解决,最终放弃了打包成jar运行的念头,就在对源码进行了修改,在eclipse运行了
二:java.lang.Exception: java.lang.ClassCastException: org.apache.hadoop.io.IntWritable cannot be cast to org.apache.hadoop.io.Text
此种错误,是由于map和reduce端函数格式输入输出不一致,导致数据类型不匹配
在次要注意一个特别容易出错的地方:Mapper和Reducer类中的函数必须是map和reduce,名字不能改,因为是继承Mapper类和Reducer类,如果函数名字改变了的话也可能造成以上的错误,或者Reducer端不输出
三:当在命令行里直接用命令转化文件格式时抛出如下错误:
ERROR common.AbstractJob: Unexpected --seqFileDir while processing Job-Specific Options
注:转化命令为:bin/mahout clusterdump --seqFileDir /home/thinkgamer/document/canopy/output/clusters-0-final/ --pointsDir /home/thinkgamer/document/canopy/output/clusteredPoints/ --output /home/thinkgamer/document/canopy/clusteranalyze.txt
上网搜了搜热心的网友给出的解决办法是:将--seqFileDir换成--input即可
- Mahout学习之运行canopy算法错误及解决办法
- mahout之canopy算法简介
- Mahout 系列之--canopy 算法
- Mahout 聚类算法学习之Canopy(一)
- mahout-0.6运行canopy聚类算法
- mahout之canopy聚类算法
- Mahout聚类算法学习之Canopy算法的分析与实现
- mahout之canopy聚类
- mahout 源码解析之聚类--Canopy算法
- mahout源码canopy算法分析之三CanopyReducer
- mahout源码canopy算法分析之二CanopyMapper
- Mahout系列之Canopy聚类算法分析
- 机器学习之聚类算法(CANOPY)
- Mahout-Canopy
- Mahout算法源码(0):搭建环境及Canopy获得输入数据
- canopy算法优化kmean聚类及在mahout上实现
- Mahout学习——Canopy Clustering
- Mahout学习——Canopy Clustering
- You must restart adb and Eclipse的问题解决
- 在Unity中添加Googole广告
- 黑马程序员--NSMutableDictionary的使用
- MVC中DropDownListFor赋初始选择值问题
- 第六周项目四数据结构实践——数制转换(栈)
- Mahout学习之运行canopy算法错误及解决办法
- 什么是7模,17频,19频乃至20频?
- 2台主机极致实现双主复制架构及MMM
- 欢迎使用CSDN-markdown编辑器
- Gas Station
- jQuery源码测试笔记之domManip函数
- GitHub的学习使用
- JavaScript Core -- 如何创建一个对象
- jre中扩展包