Lucene 全文检索实践一
来源:互联网 发布:c语言空格怎么 编辑:程序博客网 时间:2024/04/29 22:02
Lucene 是 Apache Jakarta 的一个子项目,是一个全文检索的搜索引擎库。其提供了简单实用的 API,通过这些 API,可以自行编写对文件(TEXT/XML/HTML等)、目录、数据库的全文检索程序。
Features:
* Very fast indexing, minimal RAM required
* Index compression to 30% of original text
* Indexes text and HTML, document classes available for XML, PDF and RTF
* Search supports phrase and Boolean queries, plus, minus and quote marks, and parentheses
* Allows single and multiple character wildcards anywhere in the search words, fuzzy search, proximity
* Will search for punctuation such as + or ?
* Field searches for title, author, etc., and date-range searching
* Supports most European languages
* Option to store and display full text of indexed documents
* Search results in relevance order
* APIs for file format conversion, languages and user interfaces
实践任务:
1) 编写 Java 程序 MyIndexer.java,使用 JDBC 取出 MySQL 数据表内容(以某一论坛数据做测试),然后通过 org.apache.lucene.index.IndexWriter 创建索引。
2) 编写 Java 程序 MySearcher.java,通过 org.apache.lucene.search.IndexSearcher 等查询索引。
3) 实现支持中文查询及检索关键字高亮显示。
4) 通过 PHP / Java Integration 实现对 MySearch.java 的调用。
5) 实现对 PHP 手册(简体中文) 的全文检索。
- Lucene 全文检索实践一
- Lucene实践(一):全文检索的基本原理
- Lucene实践一:全文检索的基本原理
- Lucene实践(一):全文检索的基本原理
- Lucene 全文检索实践
- Lucene 全文检索实践二
- Lucene 全文检索实践三
- Lucene 全文检索实践四
- [转]Lucene 全文检索实践
- [转]Lucene 全文检索实践
- 全文检索Lucene 应用(一)
- Lucene实践:全文检索的基本原理
- Lucene实践:全文检索的基本原理
- Lucene实践:全文检索的基本原理
- Lucene实践:全文检索的基本原理
- Lucene实践:全文检索的基本原理
- Lucene实践:全文检索的基本原理
- Lucene实践:全文检索的基本原理
- C++ Coding Standards Item 5 : Give One entity one cohesive responsibility
- 落伍最大的SL是谁 来给我解惑
- php查询下载-手机,IP,QQ,WHOIS,PR ,ALEXA,手机号,网站收录,身份证,生日
- PHP小程序—从A空间直接下载文件到B空间—RGD 1.5 上一主题 | 下一主题
- 全文检索工具包Lncene工作原理
- Lucene 全文检索实践一
- Lucene 全文检索实践二
- Cannot create PoolableConnectionFactory
- Lucene 全文检索实践三
- Lucene 全文检索实践四
- 《C++捷径教程》读书笔记--Chapter 10--结构与联合
- PC硬件的动力源泉 谈驱动程序之基础篇[引用]
- 第一次使用blog
- 业务模块的设计原则