搜索引擎学习(一):搜索引擎学习

来源:互联网 发布:迪优美特i5网络机顶盒 编辑:程序博客网 时间:2024/04/30 08:48

最近需要写一个搜索逻辑,用java代码自己写,写完后,整个人都不好了,学习学习别人强大的框架吧!


1.Lucene:

是一个索引与搜索类库,而不是完整的程序。

是一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。

2.Solr:

是一个高性能,采用Java5开发,基于Lucene的一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。

3.ElasticSearch:

是一个基于lucene的搜索服务器。它提供给一个分布式多户能力的全文搜索引擎,基于RestFul web接口。

4.Nutch:

是一个由Java实现的,刚刚诞生开放源代码(open-source)的web搜索引擎。(全文搜索和Web爬虫。

5.Hadoop: 

实现了一个分布式文件系统(hadoop Distributed File System),简称HDFS。
于 2005 年秋天作为 Lucene的子项目 Nutch的一部分正式引入。
它受到最先由 Google Lab 开发的 Map/Reduce 和 Google File System(GFS) 的启发。
2006 年 3 月份,Map/Reduce 和 Nutch Distributed File System (NDFS) 分别被纳入称为 Hadoop 的项目中。

原创粉丝点击