MyEclipse下配置heritrix 1.12.1步骤

来源:互联网 发布:编辑照片大小的软件 编辑:程序博客网 时间:2024/04/29 18:23
 

虽然前面已经有过配置了,但我感觉这篇文章还不错,就转帖了,说不定还有用处呢,呵呵……

1.     下载heritrix 1.12.1-src.zipheritrix 1.12.1.zip

2.     新建空的java项目(注意不是WEB项目)命名为heritrix

3.     heritrix-1.12.1-src/src/java/目录下的orgstcom文件夹拷贝到heritrix/src目录下

4.       heritrix-1.12.1-src/src下的webapps文件夹拷贝到Heritrix目录下

5.       右击heritrix项目,点击properties 找到如图所示的界面,然后heritrix-1.12.1-src下的lib目录下的所有包导入进来

    

6.      解压缩heritrix-1.12.1目录下的heritrix-1.12.1.jar文件,解压后的所有文件和文件夹(orgstcom文件夹和heritrix.properties文件外)拷贝到heritrix目录下

7.     heritrix-1.12.1目录下的conf文件夹拷贝到heritrix目录下并将heritrix目录下的profiles文件夹移入conf文件夹中

8.     打开eclipse下的heritrix/conf/heritrix.properties文件找到“heritrix.cmdline.admin =”修改为“heritrix.cmdline.admin = admin:admin

9.     Conf/jmxremote.password.template拷贝到heritrix目录下.改名为:jmxremote.password

最后两行改成:

monitorRole  @admin@

controlRole  @admin@

改完毕之后,保存该文件。并且需要将该文件的属性改为只读

10.配置环境变量"HERITRIX_HOME"为该项目的根目录à如:D:/mysearchweb/heritrix

   

10. 找到org.archive.crawler运行Heritrix.java中的main函数。

成功的提示信息为
01:57:30.046 EVENT  Starting Jetty/4.2.23

01:57:30.562 EVENT  Started WebApplicationContext[/,Heritrix Console]

01:57:30.734 EVENT  Started SocketListener on 127.0.0.1:8080

01:57:30.734 EVENT  Started org.mortbay.jetty.Server@179c285

Heritrix version: 1.12.1

11.   可能出现错误的问题有:

java.lang.UnsupportedClassVersionError: Bad version number in .class file

    at java.lang.ClassLoader.defineClass1(Native Method)

    at java.lang.ClassLoader.defineClass(ClassLoader.java:620)

    at java.security.SecureClassLoader.defineClass(SecureClassLoader.java:124)

    at java.net.URLClassLoader.defineClass(URLClassLoader.java:260)

    at java.net.URLClassLoader.access$100(URLClassLoader.java:56)

    at java.net.URLClassLoader$1.run(URLClassLoader.java:195)

    at java.security.AccessController.doPrivileged(Native Method)

    at java.net.URLClassLoader.findClass(URLClassLoader.java:188)

    at java.lang.ClassLoader.loadClass(ClassLoader.java:306)

    at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:268)

    at java.lang.ClassLoader.loadClass(ClassLoader.java:251)

    at java.lang.ClassLoader.loadClassInternal(ClassLoader.java:319)

Exception in thread "main"

解析原因:版本不兼容

解决方法:

先查看你的MyEclipse中的JRE是哪个版本,然后在下图中的5.0改为和你的MyEclipse相兼容的版本号。

12注意,heritrix默认使用8080端口,如果你用TOMCAT作为WEB服务器,则要保证系统端口没有冲突。修改TOMCATconf下的server.xml中的端口号为80,启动TOMCAT,然后在浏览器输入http://127.0.0.1:8080,输入用户名,密码(如前面所设置的admin:admin即用户名和密码都为admin)。就可以进入了!

原创粉丝点击