历数那些失败的项目(3)---Nutch...
来源:互联网 发布:医疗软件代理 编辑:程序博客网 时间:2024/05/16 07:07
Nutch版搜索引擎
介绍:
使用Nutch来二次开发做网站的内部搜索,JAVA,网站应用
结局:
运行2,3年后被google取代
不良点:
1. hard code成分相对多
2. 运维自动化没跟上
很多时候服务不稳定是因为集群中的部分索引服务挂掉了
磁盘满等都没有及时监控反馈
5. 对页面的评分模型有些混乱
6. 没有后续跟进优化,做完了就闲置状态了
总结:
1. 运维决定成败(不论是系统还是软件的运维)
2. 用solr来支持网站内部搜索(当时还没solr)
介绍:
使用Nutch来二次开发做网站的内部搜索,JAVA,网站应用
结局:
运行2,3年后被google取代
不良点:
1. hard code成分相对多
2. 运维自动化没跟上
很多时候服务不稳定是因为集群中的部分索引服务挂掉了
磁盘满等都没有及时监控反馈
3. 爬行性能很一般
系统比较厚重,更改策略有些麻烦
5. 对页面的评分模型有些混乱
6. 没有后续跟进优化,做完了就闲置状态了
总结:
1. 运维决定成败(不论是系统还是软件的运维)
2. 用solr来支持网站内部搜索(当时还没solr)
- 历数那些失败的项目(3)---Nutch...
- 历数那些失败的项目(1)---M...
- 历数那些失败的项目(5)---AnyTips
- 历数那些失败的项目(2)---S-Quicktake
- 历数那些失败的项目(4)---CMS网站
- 【pyhton学习笔记】历数那些遇到的错误
- React实战-历数一个混乱React项目的罪状
- 历数C#的设计错误
- 历数2013年优秀的开源游戏引擎与开源游戏项目
- 历数2013年优秀的开源游戏引擎与开源游戏项目
- 历数史上死于“如厕”的帝王!!!!!!!!!
- 历数25个最损的中文网站
- 历数CSS缩写的一些好处
- 历数两年内的重大空难事故
- 历数我用过的手机
- 历数CSS缩写的一些好处
- 历数OpenMobile开发的一些坑
- nutch中集成IK分词的步骤——基于myeclipse管理的nutch项目
- android:inputType
- 手势与触摸的事件分发机制
- 在app运行的情况下接收推送信息
- hdu 1848
- Infragistics新Windows 8 UI/UX工具包已经发布
- 历数那些失败的项目(3)---Nutch...
- js中的rows和cells的使用 dom历遍
- JAVA学习笔记(八)异常
- 训练方略13- 24 (30天突破版式攻略)营销型设计师系列
- ios url缓存策略——NSURLCache、 NSURLRequest、Http规则
- ajax请求get和post区别
- HTTP状态码一览表(HTTP Status Code)
- 关于字符串操作
- 2013年十大网址站排行榜