后台运行Heritrix常见错误
来源:互联网 发布:网络视频赌博真假 编辑:程序博客网 时间:2024/05/29 09:15
虽然什么事情都没有干但是在eclipse的控制台中打印出了日志,并且也没报错 但是web不能访问
代码是:http://guoyunsky.iteye.com/blog/642550改了一丁点东西
--------------------------------------------------------------------------------------------------
package com.stx.test;
import java.io.File;
import javax.management.InvalidAttributeValueExc
import org.archive.crawler.event.CrawlStatusListener;
import org.archive.crawler.framework.CrawlController;
importorg.archive.crawler.framework.exceptions.InitializationException;
import org.archive.crawler.settings.XMLSettingsHandler;
public class Test {
}
--------------------------------------------------------------------------------------------------
问题一:这里是吧order.xml文件和seeds.txt文件复制在根目录的
问题二:报错You must set the User-Agent and From HTTP header values toacceptable strings
问题三:
我的是第一次没有解决问题二然后再根目录里面多了一个state的文件夹里面有je.lck
为org\archive\util,在该路径下补充该文件就不报错了。
至于该文件的用途还不清楚,有高手可以指点一下。
该文件可以在源文件包src\resources路径下找到。- 后台运行Heritrix常见错误
- 如何在后台运行Heritrix
- hadoop运行常见错误
- Weka常见运行错误
- 常见的运行错误
- Giraph 运行常见错误
- 常见Python运行错误
- 运行heritrix成功!
- Heritrix运行配置
- Heritrix安装与运行
- 运行nutch常见几个错误
- 运行nutch常见几个错误
- hadoop运行常见的错误
- 运行nutch常见几个错误
- ICE 的常见运行错误
- 常见Python运行时错误
- java常见运行时错误
- 常见Python运行时错误
- Linux sed命令详解(转)
- day5
- Linux下的多进程编程初步
- Sqlite排序语句
- 容器 第四节 Iterator接口
- 后台运行Heritrix常见错误
- STL源码解析之uninitialized_fill_n简单测试-(用到了迭代器萃取和型别萃取)
- 初探PHP
- 国际化
- Flume和HBase-0.98集成时报NoSuchMethodError
- linux 下获取进程ID 和 进程名
- 多线程概述
- Linux下C/C++查找某一进程
- Hour of Code 加入有史以来最盛大的学习活动,2014年12月8日至14日