nutch2.x在eclipse+windows环境下运行遇到的一些问题的解决方案
来源:互联网 发布:淘宝直播开蚌是真的吗 编辑:程序博客网 时间:2024/05/21 18:45
1、问题 permission /tmp/hadoop....
解决方法:下载hadoop源码包,修改org.apache.hadoop.fs.FileUtil.java文件中方法checkReturnValue内容。将异常改为log。用意:不在检测文件系统路径问题
2、org.apache.gora.sql.store.SqlStore NotFound问题
此问题只在nutch2.2中存在,2.1中配置文件ivy.xml已经做了依赖配置,所以不会出现这个问题。
此类问题还有com.healthmarketscience.sqlbuilder.dbspec.Column找不到。
解决方法:配置ivy.xml,将下面一行的注释去掉。
3.问题;com.mysql.jdbc.Driver NotFound
原因:gora.properties文件中的属性值不能有任何空格,否则出现莫名其妙的问题。nutch的容错机制不太严谨。
解决方法:查看gora.properties文件属性值,是否配置有问题,尤其空格。严格排查。没行的前后空格都不行。我因为这个空格导致我搞了2天,真扯。。
4.问题:job failed: name=inject urls, jobid=job_local_0001
刚开始搭建,类似问题出现的频率最多,出现类似这样的问题我们第一想到的应该是hadoop.log这文件,而不是只看控制台。通过hadoop.log日志记录文件具体问题具体对待。下面这个解决方法只是我遇到的一个问题的权宜之计,只供参考。不要误导大家。
总结:此类问题一般是因为程序捕获到了异常,然后异常中断job后出现的。只要从hadoop.log中找到具体的问题所在,一般不会有什么问题。
解决方法:两种。
1).nutch-site.xml中取消对plugin的配置。不要使用插件的时候不会报错,可能其中某些插件存在问题。这种情况在ant之后执行runtime/local/bin下的nutch时可排除。
2).nutch2.2要修改掉ivy.xml中的gora-core依赖包的版本,修改为0.2.1
5.java.lang.OutOfMemoryError: Java heap space
这个问题才是真正导致上面第5个问题的直接原因。问题描述是在hadoop.log中看到的。
解决方法:运行参数vm arguments 添加:-Xms800m -Xmx800m
6.查看问题方法:不要总看控制台,控制台的信息不能完全解决问题,也不能完全定位问题,只能通过根目录的hadoop.log文件查看日志信息。
7、x point org.apache.nutch.net.URLNormalizer not found.
这个错是一个朋友测试nutch的时候遇到的。类似这样的问题,看看是不是插件中的类,如果是nutch插件中的类,可以肯定这些错是因为没有找到插件的原因。
解决方案:build项目之后,必须把项目的根目录下面的build文件夹复制到项目的根目录下面。然后刷新eclipse中的项目。然后还需要修改一个配置参数。
nutch-site.xml中修改plugin.folders这个属性的属性值。如下:
阅读全文
0 0
- nutch2.x在eclipse+windows环境下运行遇到的一些问题的解决方案
- windows环境下nutch2.x 在eclipse中实现抓取数据存进mysql详细步骤
- 机会网络平台haggle在Ubuntu下的运行环境配置过程遇到问题的解决方案
- nutch1.2爬虫在eclipse下运行遇到的问题
- 在windows下编译ffmpeg中遇到的一些问题
- 在windows下,用eclipse链接hadoop遇到的问题。
- 在Windows下安装Hadoop环境遇到的问题
- Pomelo在windows下环境搭建遇到的问题
- 1.cocos2d-x开发环境中遇到的一些问题及解决方案。
- tomcat7 运行在windows环境下乱码问题的解决
- eclipse 下遇到的一些问题
- 在eclipse中配置Nutch2.2.1, Windows环境下(Linux流程一样)
- windows 环境下部署spark运行环境 (包含遇到的问题和解决方法)
- 运行hadoop程序遇到的一些问题及解决方案
- php运行时遇到的一些问题和解决方案
- windows环境下安装python MySQLdb遇到的问题以及解决方案
- 在lomboz eclipse 3.3中配置tomcat7/8 server运行时环境遇到的问题
- 我在 Mac 下遇到的那些关于 终端、eclipse、Xcode以及 cocos2d-x 的问题
- RN 学习笔记
- 使用sklearn进行数据预处理 —— 归一化/标准化/正则化
- lesson24 if语句嵌套
- for循环的几种写法
- C模拟打开浏览器百度搜索词条单击结束浏览器进程
- nutch2.x在eclipse+windows环境下运行遇到的一些问题的解决方案
- seq命令,tr命令,sort命令,cut命令
- 半夜二更
- 8、自定义动画--动画篇
- Ancient Cipher
- C语言函数和主函数的调用
- 关于线性移位寄存器和快速相关攻击中的算法A和算法B详细分析解答
- linux INIT_WORK 创建工作队列
- Java(4-3)