Lucene的总体结构
来源:互联网 发布:sql group by rollup 编辑:程序博客网 时间:2024/05/19 17:59
Lucene 的构架和过程如下图,
说明Lucene是有索引和搜索的两个过程.
让我们更细一些看Lucene的各组件:
那么如何应用这些组件呢?
让我们再详细到对Lucene API 的调用实现索引和搜索过程。
- 创建一个IndexWriter用来写索引文件,它有几个参数,INDEX_DIR就是索引文件所存放的位置,Analyzer便是用来对文档进行词法分析和语言处理的。
- 创建一个Document代表我们要索引的文档。
- 将不同的Field加入到文档中。我们知道,一篇文档有多种信息,如题目,作者,修改时间,内容等。不同类型的信息用不同的Field来表示,在本例子中,一共有两类信息进行了索引,一个是文件路径,一个是文件内容。其中FileReader的SRC_FILE就表示要索引的源文件。
- IndexWriter调用函数addDocument将索引写到索引文件夹中。
- IndexReader将磁盘上的索引信息读入到内存,INDEX_DIR就是索引文件存放的位置。
- 创建IndexSearcher准备进行搜索。
- 创建Analyer用来对查询语句进行词法分析和语言处理。
- 创建QueryParser用来对查询语句进行语法分析。
- QueryParser调用parser进行语法分析,形成查询语法树,放到Query中。
- IndexSearcher调用search对查询语法树Query进行搜索,得到结果TopScoreDocCollector。
以上便是Lucene API函数的简单调用。
然而当进入Lucene的源代码后,发现Lucene有很多包,关系错综复杂。
然而通过下图,我们不难发现,Lucene的各源码模块,都是对普通索引和搜索过程的一种实现。
此图是上一节介绍的全文检索的流程对应的Lucene实现的包结构.
这篇文章仍然来自http://blog.csdn.net/forfuture1978/archive/2009/10/30/4745802.aspx。向原作者表示感谢。
- Lucene的总体结构
- Lucene学习笔记:Lucene的总体结构
- lucene的总体架构
- lucene的总体架构
- Lucene的总体架构
- Lucene的总体架构
- Lucene的总体架构简介
- 二:Lucene的总体架构
- 数据库的总体结构
- SharpMap的总体结构
- 全文索引----Lucene的总体架构
- Lucene学习总结之二:Lucene的总体架构
- Lucene学习总结之二:Lucene的总体架构
- Lucene学习总结之二:Lucene的总体架构
- Lucene学习总结之二:Lucene的总体架构
- Lucene学习总结之二:Lucene的总体架构
- Lucene学习总结之二:Lucene的总体架构
- Lucene学习总结之二:Lucene的总体架构
- 汽车驾照分类
- 免费的Android UI库及组件推荐
- spring2.5注解驱动
- 淘宝的应用无状态(淘宝session框架)
- 61850 中变电站的配置进行了研究和设计
- Lucene的总体结构
- VMware Infrastructure 3常见管理问题解答
- POJ 2516 Minimum Cost (最小费用最大流,KM解法)
- Install VirtualBox 4.1.4 on Fedora 15/14, CentOS/Red Hat (RHEL) 5.6/6
- 数据结构_图_求无向图的关节点
- JDK的动态代理深入解析(Proxy,InvocationHandler)
- 调用系统函数pthread_cancel取消进程的其他线程
- curl/fsockopen/file_get_contents 三个函数 都可以实现采集模拟发言,三者有什么区别,或者讲究么?
- asp.net在后台获取html控件值