Nutch分布式检索配置

来源:互联网 发布:天猫魔盒网络机顶盒 编辑:程序博客网 时间:2024/05/16 00:35

Nutch版本:0.7.2,也适用于1.0

1、 同样Nutch程序分发在N台服务器上
2、 在一台服务器上部署tomcat,修改其中nutch-site.xml,将search.dir指向包含search-servers.txt的目录
3、 search-servers.txt目录中存放运行nutch服务的服务器ip及其监听端口
4、 启动各个nutch server。server [port] /path/to/crawleddata/
5、 在检索服务器上启动tomcat

原创粉丝点击