nutch配置问题
来源:互联网 发布:蛮荒之怒翅膀进阶数据 编辑:程序博客网 时间:2024/06/10 19:50
使用的是nutch 1.3的版本
基本配置和安装,根据官网tutorial的内容即可了。
http://wiki.apache.org/nutch/NutchTutorial
要点说明:需要配置nutch-site.xml。具体属性项可以参考nutch-default.xml
http://wiki.apache.org/nutch/RunNutchInEclipse
主要遇到以下的问题:
Exception in thread "main" java.io.IOException: Job failed!
at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:1252)
at org.apache.nutch.crawl.Injector.inject(Injector.java:217)
at org.apache.nutch.crawl.Crawl.run(Crawl.java:126)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
at org.apache.nutch.crawl.Crawl.main(Crawl.java:54)
参看nutch 1.3目录下的logs目录下的hadoop.log有这么这么一段:
2011-08-10 19:29:40,039 WARN mapred.LocalJobRunner - job_local_0001
java.lang.OutOfMemoryError: Java heap space
得知虚拟机的默认内存不够,需要在jvm argument中,加上这么一句:
-Xmx500m
成功!!!!!!!!!!!!
- nutch配置问题
- nutch配置问题
- nutch 的配置错误问题
- Nutch 0.9分布式配置
- nutch安装及配置
- Nutch-1.0配置
- Nutch 的配置
- Nutch分布式检索配置
- Nutch环境配置
- Nutch分布式检索配置
- 配置nutch成功
- nutch 【配置与运行】
- 配置nutch软件
- 配置nutch软件
- 备忘录:Nutch+eclipse配置
- 备忘录:Nutch+eclipse配置
- nutch-2.0集群配置
- Win7 配置 Nutch 1.2
- axis2快速发布服务(创建client)
- C++学习笔记序列之返回语句区别总结
- SQL2008 建立job, 用代理 运行ssis包
- 浅谈HTTP中Get与Post的区别
- 网站营销方案需要考虑的因素
- nutch配置问题
- Manage Linux ISO image files.
- Android深入探究笔记之二十 -- 广播接收者,BroadcastReceiver
- 编程工具
- 浏览器对上传文件的限制
- 约瑟夫
- VC++ MFC 写窗口,在对话框运行时按回车键,对话框自动关闭了……
- 本周完美国际新网通天羽区龙吟天下城战
- orcal