【Nutch2.2.1基础教程之1】nutch相关异常
来源:互联网 发布:js 使input不可编辑 编辑:程序博客网 时间:2024/05/15 22:17
1、在任务一开始运行,注入Url时即出现以下错误。
InjectorJob: Injecting urlDir: urls
InjectorJob: Using class org.apache.gora.hbase.store.HBaseStore as the Gora storage class.
InjectorJob: java.lang.RuntimeException: job failed: name=[20140000]inject urls, jobid=job_local1629320149_0001
at org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:54)
at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:233)
at org.apache.nutch.crawl.InjectorJob.inject(InjectorJob.java:251)
at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:273)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
at org.apache.nutch.crawl.InjectorJob.main(InjectorJob.java:282)
at org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:54)
at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:233)
at org.apache.nutch.crawl.InjectorJob.inject(InjectorJob.java:251)
at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:273)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
at org.apache.nutch.crawl.InjectorJob.main(InjectorJob.java:282)
原因是regex-urlfilter.txt配置错误
0 0
- 【Nutch2.2.1基础教程之1】nutch相关异常
- 【Nutch2.2.1基础教程之1】nutch相关异常
- 【Nutch2.2.1基础教程之2.2】集成Nutch/Hbase/Solr构建搜索引擎之二:内容分析
- 【Nutch2.2.1基础教程之2.2】集成Nutch/Hbase/Solr构建搜索引擎之二:内容分析
- 【Nutch2.2.1基础教程之6】Nutch2.2.1抓取流程
- 【Nutch2.2.1基础教程之3】Nutch2.2.1配置文件
- 【Nutch2.2.1基础教程之6】Nutch2.2.1抓取流程
- 【Nutch2.2.1基础教程之3】Nutch2.2.1配置文件
- 【Nutch2.2.1基础教程之2.1】集成Nutch/Hbase/Solr构建搜索引擎之一:安装及运行【单机环境】
- 【Nutch2.2.1基础教程之2.1】集成Nutch/Hbase/Solr构建搜索引擎之一:安装及运行【单机环境】
- 使用 Hadoop,Nutch ,Hbase,Solr 搭建搜索引擎之Nutch2.2.1
- Nutch基础教程(2.3.1版本)--Nutch2.3.X爬虫任务概述
- 【Apache Nutch系列】Nutch2.0配置安装异常集锦
- 【Nutch2.2.1源代码分析之4】Nutch加载配置文件的方法
- 【Nutch2.2.1源代码分析之4】Nutch加载配置文件的方法
- nutch2.1 部署异常集合
- 【Nutch2.3基础教程】集成Nutch/Hadoop/Hbase/Solr构建搜索引擎:安装及运行【集群环境】
- 【Nutch2.3基础教程】集成Nutch/Hadoop/Hbase/Solr构建搜索引擎:安装及运行【集群环境】
- window.onload,<body onload="function()">, document.onreadystatechange, httpRequest.onreadystatechang
- myeclipse安装插件方法
- javascript中定义事件的三种方式
- javascript的全局变量
- hibernate使用hql跨表查询遇到的问题以及解决方式
- 【Nutch2.2.1基础教程之1】nutch相关异常
- eclipse gradle插件配置
- 【Nutch2.2.1基础教程之6】Nutch2.2.1抓取流程
- Hadoop1.2.1伪分布模式安装指南
- Hadoop基本原理之一:MapReduce
- 8大排序算法图文讲解
- 【Nutch2.2.1基础教程之3】Nutch2.2.1配置文件
- hdu 2222
- 最完美解决Nginx部署ThinkPHP项目的办法