Eclipse中加载Nutch遇到的问题

来源:互联网 发布:朝鲜 中国 关系 知乎 编辑:程序博客网 时间:2024/06/11 08:20

《Lucene+nutch搜索引擎开发》83页:
(5)完成必要的配置工作,包括把从conf目录添加到build->classpath;把src/test添加到源代码目录(source folders);添加所有的lib下面的jars和plugin lib中的所有文件到工程中。

这段话写的太概括了(其实是自己了解的太少了,但是我相信很多人都不清楚具体的操作),详细操作如下:

第一步:添加conf目录到buid->Classpath.我是这样做的:
选中所建的Nutch工程,依次点击Project(任务栏上)->Properties->Java Build Path
->Libraries(右上第三个选项)->Add Class Folder... (右边第五个)
->Create New Folder...(弹出框下面) ->Advanced》
->勾上Link to folder in the file system ->Browse... ->选择你的conf目录路径:
(e.g.with mine D:\nutch-1.0\conf)->确定并OK,这样你的工程Nutch下就应该
有conf文件夹了。
第二步:添加"src/test"到源代码目录(Source folders):
选中所建的Nutch工程,依次点击Project(任务栏上)->Properties->Java Build Path
->Source(右上) ->Link Source... ->Browse... ->选择你的test目录路径:(以我的为
例:D:\nutch-1.0\src\test ->Finish并OK。
第三步:添加所有的lib下面的jars和plugin lib中的所有文件到工程中。
选中所建的Nutch工程,依次点击Project(任务栏上)->Properties->Java Build Path
->Libraries(右上第三个选项)->Add External JARs... (右边第二个)->找到你的nutch1.0
中的lib文件夹(以我的为例:D:\nutch-1.0\lib),将其中所有的.jar文件选中 ->单击打开按
钮,同样找到nutch1.0中的plugins文件夹中所有以lib-开头的文件夹,把里面的.jar文件选中
加入Libraries中。(似乎Libraries中已经有了,不过最好这样操作一次)。完成后按下OK

另外,在编译时遇到如下问题:\nutch-0.9\build.xml:61: Specify at least one source--a file or resource collection. 网上查到的答案是:
You've got 2 options to solve this:
1. export the missing config/*.template files from the SVN-Repository
2. edit build.xml:61 so that it doesn't want to touch these *.template files.

不过,还是不太确定具体的含义,就直接把60~62三行全删了,至今没有遇到错误!


缺少的两个包:

http://nutch.cvs.sourceforge.net/viewvc/nutch/nutch/src/plugin/parse-mp3/lib/jid3lib-0.5.1.jar?view=log

http://nutch.cvs.sourceforge.net/viewvc/nutch/nutch/src/plugin/parse-rtf/lib/rtf-parser.jar?view=log

可在


原创粉丝点击