Lucene学习

来源:互联网 发布:房产经纪人用什么端口 编辑:程序博客网 时间:2024/06/15 04:15

Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。
其功能非常的强大,api也很简单。总得来说用Lucene来进行建立 和搜索和操作数据库是差不多的(有点像),Document可以看作是 数据库的一行记录,Field可以看作是数据库的字段。用lucene实 现搜索引擎就像用JDBC实现连接数据库一样简单。

如果你想快速查询你磁盘上文件,或查询邮件、Web页面,甚至查询存于数据库的数据,你都可以借助于Lucene来完成。但是要完成查询就必须先建立索引。首先从Lucene API说起:

1、 Lucene API(核心操作类)
IndexWriter 创建和维护索引(向原索引中添加新Document,设置合并策略、优化等)
FSDirectory 最主要用来存储索引文件的类,表示将索引文件存储到文件系统
Document 索引和查询的原子单元,一个Document包含一系列Field
IndexReader 一个抽象类,提供了访问索引的接口,当然访问索引也可以通过它的子类来完成
Analyzer 分词类,它有一系列子类,都是用来将文本解析成TokenStream
Searcher 用于查询索引的核心类