历数那些失败的项目(3)---Nutch...

来源:互联网 发布:医疗软件代理 编辑:程序博客网 时间:2024/05/16 07:07
Nutch版搜索引擎

介绍:
使用Nutch来二次开发做网站的内部搜索,JAVA,网站应用

结局:
运行2,3年后被google取代


不良点:
1. hard code成分相对多
2. 运维自动化没跟上
    很多时候服务不稳定是因为集群中的部分索引服务挂掉了
    磁盘满等都没有及时监控反馈

3. 爬行性能很一般

   系统比较厚重,更改策略有些麻烦

4. 对ajax等网页不支持
5. 对页面的评分模型有些混乱
6. 没有后续跟进优化,做完了就闲置状态了

总结:
1. 运维决定成败(不论是系统还是软件的运维)
2. 用solr来支持网站内部搜索(当时还没solr)

原创粉丝点击