Nutch与Lucene区别
来源:互联网 发布:深圳软件产业基地公寓 编辑:程序博客网 时间:2024/05/08 16:02
Nutch 是基于 Lucene的。Lucene为 Nutch 提供了文本索引和搜索的API。
一个常见的问题是;我应该使用Lucene还是Nutch?最简单的回答是:如果你不需要抓取数据的话,应该使用Lucene。如果你有数据源,需要为这些数据提供一个搜索页面。在这种情况下,最好的方式是直接从数据库中取出数据并用Lucene API建立索引。Nutch 适用于你无法直接获取数据库中的网站,或者比较分散的数据源的情况下使用。
Lucene其实是一个提供全文文本搜索的函数库,它不是一个应用软件。它提供很多API函数让你可以运用到各种实际应用程序中。现在,它已经成为Apache的一个项目并被广泛应用。
Nutch是一个建立在Lucene核心之上的Web搜索的实现,它是一个真正的应用程序。也就是说,你可以直接下载下来拿过来用。它在Lucene的基础上加了网络爬虫和一些和Web相关的东东。其目的就是想从一个简单的站内索引和搜索推广到全球网络的搜索上。
- Nutch与Lucene区别
- Nutch与Lucene区别
- Lucene(Nutch)与商业文本搜索引擎的区别
- nutch和lucene的区别
- nutch和lucene的区别
- nutch和lucene的区别
- nutch和lucene的区别
- Nutch和Lucene的区别
- solr/lucene和nutch/lucene的区别
- 全文索引-lucene,solr,nutch,hadoop之nutch与hadoop
- 全文索引-lucene,solr,nutch,hadoop之nutch与hadoop
- lucene nutch solr及hadoop的区别和联系
- Nutch/Lucene的存取机制与结构分析
- Nutch/Lucene的存取机制与结构分析(收藏)
- 利用Lucene与Nutch构建简单的全文搜索引擎
- 1.搜索之路——Nutch与Lucene
- Spirit+lucene+nutch
- lucene-Nutch分析
- 超五类和六类线
- 跨平台视频聊天
- 使用curl的简单实例
- ssh登录vps
- 等你,执手渡流年(七夕)
- Nutch与Lucene区别
- 勿在浮沙筑高楼-先熟基础内容
- WebService 超简单入门教程(Java)
- Linux运行与控制后台进程的方法:nohup, setsid, &, disown, screen
- jQuery位置选择器
- ibatis log4j 配置 显示sql
- (草稿)模拟真实的用户进行压力的并发原理
- Ubuntu cp如何复制符号连接文件
- 我问佛(转)