nutch 0.7 plug-ins 详解
来源:互联网 发布:starstail mac 编辑:程序博客网 时间:2024/05/18 00:27
1、nutch 0.7 发布了;
2、nutch 的java源代码包路径改变成了org.apache...
3、yahoo也使用了nutch,并做了很多的工作。1 2
clustering-carrot2 :
一个搜索结果类聚的代码框架,目前和Egothor等搜 索引擎结合的很好;
地址:http://sourceforge.net/projects/carrot2
相关类:org.apache.nutch.clustering.OnlineClusterer
Nutch Online Search Results Clustering Plugin
org.apache.nutch.clustering.carrot2
Carrot2 Clusterer
creativecommons :
一个创作共用的工具集合。地址:http://creativecommons.org/ ;
相关类:
org.apache.nutch.parse.HtmlParseFilter
HTML Parse Filter
org.apache.nutch.indexer.IndexingFilter
Nutch Indexing Filter
org.apache.nutch.searcher.QueryFilter
Nutch Query Filter
index-basic :
相关类:
org.apache.nutch.indexer.IndexingFilter
Nutch Indexing Filter
index-more :
language-identifier : 语言检测工具;
相关类:
org.apache.nutch.analysis.lang.LanguageParser
Nutch language Parser
org.apache.nutch.analysis.lang
Nutch language identifier filter
org.apache.nutch.analysis.lang.LanguageQueryFilter
Nutch Language Query Filter
ontology : 一个概念话的规范,主要是针对人工智能的;
相关类:
org.apache.nutch.ontology.Ontology
Ontology Model Loader
parse-ext :
parse-html :
parse-js : 解析js文档
parse-msword : 解析msword文档
parse-pdf : 解析pdf文档
相关类:
org.apache.nutch.parse.pdf.PdfParser
parse-rss : 解析Rss格式文档
parse-text : 解析text文档
protocol-file :
protocol-ftp :
protocol-http :
protocol-httpclient :
query-basic :
query-more :
query-site :
query-url :
urlfilter-prefix :
urlfilter-regex :
2、nutch 的java源代码包路径改变成了org.apache...
3、yahoo也使用了nutch,并做了很多的工作。1 2
clustering-carrot2 :
一个搜索结果类聚的代码框架,目前和Egothor等搜 索引擎结合的很好;
地址:http://sourceforge.net/projects/carrot2
相关类:org.apache.nutch.clustering.OnlineClusterer
Nutch Online Search Results Clustering Plugin
org.apache.nutch.clustering.carrot2
Carrot2 Clusterer
creativecommons :
一个创作共用的工具集合。地址:http://creativecommons.org/ ;
相关类:
org.apache.nutch.parse.HtmlParseFilter
HTML Parse Filter
org.apache.nutch.indexer.IndexingFilter
Nutch Indexing Filter
org.apache.nutch.searcher.QueryFilter
Nutch Query Filter
index-basic :
相关类:
org.apache.nutch.indexer.IndexingFilter
Nutch Indexing Filter
index-more :
language-identifier : 语言检测工具;
相关类:
org.apache.nutch.analysis.lang.LanguageParser
Nutch language Parser
org.apache.nutch.analysis.lang
Nutch language identifier filter
org.apache.nutch.analysis.lang.LanguageQueryFilter
Nutch Language Query Filter
ontology : 一个概念话的规范,主要是针对人工智能的;
相关类:
org.apache.nutch.ontology.Ontology
Ontology Model Loader
parse-ext :
parse-html :
parse-js : 解析js文档
parse-msword : 解析msword文档
parse-pdf : 解析pdf文档
相关类:
org.apache.nutch.parse.pdf.PdfParser
parse-rss : 解析Rss格式文档
parse-text : 解析text文档
protocol-file :
protocol-ftp :
protocol-http :
protocol-httpclient :
query-basic :
query-more :
query-site :
query-url :
urlfilter-prefix :
urlfilter-regex :
- nutch 0.7 plug-ins 详解
- nutch 0.7 plug-ins 详解
- nutch 0.7 plug-ins 详解
- JQuery Chart Plug-ins
- Maven plug-ins
- eclipse plug-ins导出
- Game Plug-ins(3)
- Game Plug-ins(2)
- Game Plug-ins(1)
- Develop Eclipse Plug-ins Tutorial
- 开发Eclipse插件(Plug-ins)
- Using legacy plug-ins with .NET
- Develop the Language Plug-ins for Eclipse
- Nice ogre plug-ins and projects
- android-application-plug-ins-frame-work
- android-application-plug-ins-frame-work .
- android-application-plug-ins-frame-work
- zTree -- jQuery tree plug-ins 学习笔记
- The Freeze Pane DataGrid
- JBPM的任务分派机制
- 同时使用数据库链和序列时应注意的几点
- 关于软件管理提升系统培训
- C#2.0学习6--泛型
- nutch 0.7 plug-ins 详解
- Nutch 的小技巧
- 胖瘦客户端优点集于一身
- 揭开Smart Client技术真谛
- 关于《Windows下的HEAP溢出及其利用》一文的疑惑
- 毕业设计中怎样用python写一个搜索引擎的分布式爬虫---异样的美感
- Nutch搜索引擎之分布式文件系统
- C#2.0学习7--匿名方法,迭代器
- 使用.bat文件在Windows下运行Java程序时怎样避免DOS窗口