Nutch1.2增加插件例子

来源:互联网 发布:caffe 中文教程 编辑:程序博客网 时间:2024/04/28 00:46

今尝试下给nutch1.2增加一个插件,于是到官网找了个例子,链接如下:

http://wiki.apache.org/nutch/WritingPluginExample-0.9

这个例子实现的的是推荐网站,就是写关键字在content里,当别人搜索这个关键字时,你推荐的网站在搜索结果中排前,要实现推荐必须在你的网页上加上

这条属性才能被插件识别。

由于它这个例子是用nutch0.9的,而且1.2和0.9有些区别,于是要修改一些代码。步骤如下:

1.插件开放

1.1在src/plugin中新建一个文件夹recommend

1.2.在recommend目录下新建Plugin.xml和Build.xml文件,内容如下:

 

Plugin.xml

Build.xml

1.3.在recommended目录下建立/src/java/org/apache/nutch/parse/recommended目录。

1.4.增加RecommendedIndexer.java,RecommendedParser.java,RecommendedQueryFilter.java三个类,内容如下:

RecommendedIndexer.java

RecommendedParser.java

RecommendedQueryFilter.java

1.5.在 src/plugin/build.xml 中的<target name="deploy"></target>中增加一行:

1.6.运行cmd,切换到recommend目录,运行ant命令编译,插件开发完成。

 

1.7 让nutch识别你的插件

      在conf/nutch-site.xml 中增加一下属性

 

2.编写插件测试类

 

2.1 在src/plugin中/recommend目录下新建一个data目录,在data目录下新建一个html文件recommended.html内容如下:

2.2 在src/plugin中/recommend目录下新建src/test/org/apache/nutch/parse/recommended目录,增加TestRecommendedParser.java类,内容如下:

2.3 用junit运行TestRecommendedParser.java测试。

                                   

 

                                                                                                                                                                       2010-10-09

原创粉丝点击