Solr3.6.2与nutch1.6的整合

来源:互联网 发布:金融炼金术 知乎 编辑:程序博客网 时间:2024/05/20 13:07

之前已经配置好nutch1.6的相关信息,这时候到官网上下载solr3.6.

nutch以前版本有war可以直接进行界面化的搜索,1.5之后没有了,用solr进行处理来进行查询。

解压之后:

1.      apache-nutch-1.6/conf/schema.xml文件拷贝到apache-solr-3.6.2\example\solr\conf目录下覆盖掉原来的schema.xml

2.      修改solrconfig.xml文件找到<str name="df">id</str>改为content,可能会有文章说修改为text,因为之前版本是text作为df的,这个不修改后面会出现错误,修改为text在搜索的时候会出现问题。稍后会提到。

3.      建立索引到solr

bin/nutch solrindex http://127.0.0.1:8983/solr/ crawl/crawldb -linkdb crawl/linkdb crawl/segments/*

4.启动solr,进入到apache-solr-3.6.2\example目录,使用java –jar start.jar命令启动

5.访问http://127.0.0.1:8983/solr/admin

直接进行query

上面如果不把id改为content而改为text这里就只能*:*这种情况才会有结果,输入其他信息没有查询结果。

原创粉丝点击