Luence和Nutch的关系及区别
来源:互联网 发布:oracle 数据库备份 编辑:程序博客网 时间:2024/06/05 12:50
Nutch 是基于 Lucene的。Lucene为 Nutch 提供了文本索引和搜索的API。
一个常见的问题是;我应该使用Lucene还是Nutch?最简单的回答是:如果你不需要抓取数据的话,应该使用Lucene。如果你有数据源,需要为这些数据提供一个搜索页面。在这种情况下,最好的方式是直接从数据库中取出数据并用Lucene API建立索引。Nutch 适用于你无法直接获取数据库中的网站,或者比较分散的数据源的情况下使用。
Lucene其实是一个提供全文文本搜索的函数库,它不是一个应用软件。它提供很多API函数让你可以运用到各种实际应用程序中。现在,它已经成为Apache的一个项目并被广泛应用。
Nutch是一个建立在Lucene核心之上的Web搜索的实现,它是一个真正的应用程序。也就是说,你可以直接下载下来拿过来用。它在Lucene的基础上加了网络爬虫和一些和Web相关的东东。其目的就是想从一个简单的站内索引和搜索推广到全球网络的搜索上。
阅读全文
0 0
- Luence和Nutch的关系及区别
- Luence和Solr的区别简介
- nutch和lucene的关系
- Luence Solr Nutch说明
- lucene nutch solr及hadoop的区别和联系
- nutch和lucene的区别
- nutch和lucene的区别
- nutch和lucene的区别
- nutch和lucene的区别
- Heritrix 和 Nutch的区别
- Nutch和Lucene的区别
- 线程和进程的关系及区别
- MPDU 和 MSDU 的区别及关系
- solr/lucene和nutch/lucene的区别
- Nutch和Heritrix的区别汇总
- Lucene、Nutch和Hadoop三者之间的关系
- 开放式基金和封闭式基金的关系及主要区别
- apache和tomcat的主次关系及区别
- fatal error LNK1169: 找到一个或多个多重定义的符号
- css设置字体
- 516. Longest Palindromic Subsequence(第十七周)
- lec6 训练神经网络2
- Java学习路线图
- Luence和Nutch的关系及区别
- 欢迎使用CSDN-markdown编辑器
- CSS中可以和不可以继承的属性
- MATLAB中plot函数功能详解
- QQ登录跳转
- Java常用模式设计
- Andorid-fragment碎片
- Linux学习第十三篇--如何理解inode节点和文件系统
- mysql数据库的基本知识点