Heritrix在开发环境myEclipse下的配置方法
来源:互联网 发布:纳米二氧化钛有毒知乎 编辑:程序博客网 时间:2024/04/29 21:51
配置的时候,先从网上搜的配置方法,但不知道怎么回事,老是配置不成功,就是输入http://127.0.0.1:8090(我设置的端口是8090)时,打不开。我看网上配置的方法都是大同小异的,但不知道怎么到我这就不成功了,很苦恼。后来不知怎么的,就认认真真的按部就班的按一篇文章上写的配置,配置成功了。
下面是我配置成功参考的步骤:
主要步骤如下:
1. 下载heritrix-1.14.4.zip和heritrix-1.14.4-src.zip,分别解压到heritrix-1.14.4和heritrix-1.14.4-src;
2.新建空的Java Project, 命名为Heritrix(路径为%MYECLIPSE_HOME%/workspace/Heritrix); (注:Eclipse在创建工程有两种选择,可不用把代码放进src目录,默认的话,会生成bin和src文件夹的,在下图选择,第一个就是不用放在src,第二个是默认的。我选择的是不把代码放到src中
3. 把heritrix-1.14.4-src/src/java/目录下的org文件夹和st文件夹拷贝到Heritrix根目录下;
把heritrix-1.14.4/src下的webapps文件夹拷贝到Heritrix根目录下;
把heritrix-1.14.4-src下的lib目录拷贝到Heritrix根目录下;
4. 解压缩heritrix-1.14.4目录下的heritrix-1.14.4.jar文件到heritrix_jar文件夹,把heritrix_jar目录下的modules、profiles、selftest三个文件夹以及arcMetaheaderBody.xsl、heritrix.properties、jndi.properties拷贝到Heritrix根目录下;
5. 在项目Herirtix的Propertries->Java Build Path->Liabraries->Add External JARs 引入F:/Heritrix/heritrix-1.14.4-src/lib的jar包
6. 打开Heritrix /heritrix.properties文件,找到“heritrix.cmdline.admin =”,修改为“heritrix.cmdline.admin = admin:admin”;“heritrix.cmdline.port = 8090”
7. 找到org.archive.crawler包,运行Heritrix.java中的main函数,run as Java Application。得到下面的提示信息:
11:55:13.750 EVENT Starting Jetty/4.2.23
11:55:14.218 EVENT Started WebApplicationContext[/,Heritrix Console]
11:55:14.437 EVENT Started SocketListener on 127.0.0.1:8090
11:55:14.437 EVENT Started org.mortbay.jetty.Server@a01335
Heritrix version: 1.14.3
可能出现的问题:
配置好之后当我们运行Heritrix.java的时候可能编译不通过。这是因为sun包是受保护的包,默认只有sun公司的软件才能使用。myEclipse会报错,把对保护使用waring就可以了。修改方式(myEclipse菜单栏):
Windows -> Preferences -> Java -> Compiler -> Errors/Warnings-> Deprecated and trstricted API -> Forbidden reference (access rules): -> change to warning
8、在org.archive.crawler包中找到Heritrix.java文件并运行。可以在浏览器中键入http://127.0.0.1:8090察看结果。
- Heritrix在开发环境myEclipse下的配置方法
- Heritrix在Eclipse下的配置方法
- 配置Heritrix在MyEclipse下运行
- 配置Android在MyEclipse下的开发环境
- heritrix 在myeclipse中的配置
- Heritrix 在 elipse下的配置
- 在myeclipse下配置osworkflow的环境
- Heritrix Eclipse下环境配置
- Heritrix Eclipse下环境配置
- Heritrix Eclipse下环境配置
- 在eclipseIDE下配置heritrix
- MyEclipse下配置heritrix 1.12.1步骤
- MyEclipse下配置heritrix 1.12.1步骤
- MyEclipse下配置heritrix 1.12.1步骤
- MyEclipse下配置heritrix 1.12.1步骤
- Heritrix的启动和在eclipse下的配置
- W10下,基于myeclipse的hadoop开发环境的配置
- 下载SWT Designer,配置myeclipse下的swing开发环境
- 转载 java从控制台读取输入的方法
- 什么是脏读、不可重复读、幻读
- MATHEMATICA处理线性规划与非线性规划问题 (2010-08-02 10:34:55)转载
- InvalidateRect validateRect
- 11
- Heritrix在开发环境myEclipse下的配置方法
- 纠结过后的决定
- SDI窗体中使用mscom控件通信当窗体切换时如何使其通信不中断
- c++操作mysql - 查询结果集
- 学了这么久了
- 存储引擎揭秘:基本结构之二——页
- VS2008无法调试Silverlight应用程序的原因
- 随笔0
- postgresql jdbc 连接数据库测试