(转)Heritrix1.14.1在Eclipse下的配置总结
来源:互联网 发布:赌球软件 编辑:程序博客网 时间:2024/06/05 14:17
1、在Eclipse下新建一个项目。(哪一个版本应该无所谓吧,JDK1.5);
2、将1.14.1版的Heritrix两个.zip文件下载并解压到临时目录(heritrix-1.14.1-src.zip和heritrix-1.14.1.zip);
3、从第一个zip文件解压目录下/src/java复制三个文件夹(包):org、com、st到项目中的src上;
4、从第一个zip文件解压目录下/src/conf复制所有文件夹及文件到项目根目录中(可能有不需要的文件);
5、从第一个zip文件解压目录下/src/resourses复制所有文件夹及文件到项目根目录中(可能有不需要的文件);
6、从第二个zip文件解压目录下复制webapps目录到项目根目录中;
7、把项目下Heritrix.properties文件复制到/src目录下(实践中发现);
8、在项目上鼠标右键->构建路径->添加外部归档 找到任意一个解压的目录下的lib文件夹,选中文件夹中的所有包;
9、从第一个zip文件解压目录下/src/conf/下的profiles文件夹复制到Eclipse工作空间所在分区的根目录;
10、配置Heritrix.properties,主要配置四项:如下红色部分所示
##############################################################################
# HERITRIX PROPERTIES
##############################################################################
# Properties with prefixes 'heritrix.', 'org.archive.', or 'system.' prefix
# get copied into System.properties on startup so available via
# System.getProperties. (For 'system.' properties, that prefix is stripped.
# (See Heritrix.loadProperties()).
# Version is filled in by the maven.xml pregoal. It copies here the project
# currentVersion property.
heritrix.version = 1.14.1
# Location of the heritrix jobs directory.
heritrix.jobsdir = jobs
# Default commandline startup values.
# Below values are used if unspecified on the command line.
heritrix.cmdline.admin = admin:admin
heritrix.cmdline.port = 8088
heritrix.cmdline.run = false
heritrix.cmdline.nowui = false
heritrix.cmdline.order =
heritrix.cmdline.jmxserver = false
heritrix.cmdline.jmxserver.port = 8081
##############################################################################
# LOGGING
##############################################################################
11、在Eclipse下启动Heritrix,找到项目src下的org.archive.crawler包下的主类Heritrix.java鼠标右键->运行方式->java项目,即可启动Heritrix!
启动后,Eclipse状态栏信息如下:
08:32:15.468 EVENT Starting Jetty/4.2.23
08:32:15.734 WARN!! Delete existing temp dir C:/DOCUME~1/ycf/LOCALS~1/Temp/Jetty_127_0_0_1_8088__ for WebApplicationContext[/,jar:file:/E:/projects/eclipse_workspace/Heritrix1.14.1/webapps/admin.war!/]
08:32:16.171 EVENT Started WebApplicationContext[/,Heritrix Console]
08:32:16.609 EVENT Started SocketListener on 127.0.0.1:8088
08:32:16.609 EVENT Started org.mortbay.jetty.Server@137c60d
Heritrix version: 1.14.1
上面的包的复制都在直接在Eclipse里面的项目上直接进行的,这样可以减少修改Eclipse的项目配置文件。
上文参见原文:http://www.javaeye.com/topic/262753
其它参考:
http://hi.baidu.com/wangyantsing/blog/item/9a14ba01c51a9a00728da540.html/cmtid/2645d6397d64bdfe3b87ce6c
http://menglh.javaeye.com/blog/411357
- (转)Heritrix1.14.1在Eclipse下的配置总结
- 在 eclipse 下的heritrix1.14.4的配置
- Heritrix1.14.3 在Eclipse 配置总结
- Heritrix1.14.3 在Eclipse 配置总结
- eclipse下配置Heritrix1.14.4
- heritrix1.14.4 源代码在eclipse下最简单的配置方法-------不会报错!
- Heritrix1.14.4在Eclipse的配置和使用
- Heritrix1.14.4在Eclipse中的配置
- 在ECLIPSE下配置Heritrix1.14.3(绝对可行,成功配置了)
- heritrix1.12.1不用eclipse的配置
- eclipse中配置heritrix1.14.3
- eclipse中配置heritrix1.14.3
- windows下配置Heritrix1.14.4安装配置
- eclipse下运行heritrix1.14.4报错
- 在Eclipse中构建Heritrix1.14.4
- [转]wxWidgets在Eclipse下的配置
- 在MyEclipse7.5配置Heritrix1.14.4
- 在Myeclise中配置heritrix1.14.4
- 20100930
- 最后我流着眼泪
- WINDBG调试DUMP文件
- 使用数据库加密保护敏感数据
- 无题
- (转)Heritrix1.14.1在Eclipse下的配置总结
- 什么是Wine
- Oracle10G备忘录
- 管理安全
- dbcp基本配置和重连配置(转自Javaeye精华帖)
- 查看SQLServer版本信息
- MeeGo开发中安装Dropbox等应用详解
- ARM-Linux平台UDHCP配置笔记
- 管理索引