Lucene入门(一)
来源:互联网 发布:思科网络技术学校pdf 编辑:程序博客网 时间:2024/05/16 02:52
1. 什么是Lucene
Lucene是Apache的开源项目。它是一个用Java写的全文索引引擎工具包,可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能。
图 1 表示了搜索应用程序和 Lucene 之间的关系,也反映了利用 Lucene 构建搜索应用程序的流程:
2. 搜索和索引
索引是现代搜索引擎的核心,建立索引的过程就是把源数据处理成非常方便查询的索引文件的过程。为什么索引这么重要呢,其实和字典的索引目录原理相同;试想你现在要在大量的文档中搜索含有某个关键词的文档,那么如果不建立索引的话你就需要把这些文档顺序的读入内存,然后检查这个文章中是不是含有要查找的关键词,这样的话就会耗费非常多的时间,想想搜索引擎可是在毫秒级的时间内查找出要搜索的结果的。这就是由于建立了索引的原因,你可以把索引想象成这样一种数据结构,他能够使你快速的随机访问存储在索引中的关键词,进而找到该关键词所关联的文档。Lucene 采用的是一种称为倒排索引(inverted index)的机制。倒排索引就是说我们维护了一个词 / 短语表,对于这个表中的每个词 / 短语,都有一个链表描述了有哪些文档包含了这个词 / 短语。
这样在用户输入查询条件的时候,就能非常快的得到搜索结果。我们将在本系列文章的第二部分详细介绍 Lucene 的索引机制,由于 Lucene 提供了简单易用的 API,所以即使读者刚开始对全文本进行索引的机制并不太了解,也可以非常容易的使用 Lucene 对你的文档实现索引。下面是建立和维护索引的系统结构图。
对文档建立好索引后,就可以在这些索引上面进行搜索了。搜索引擎首先会对搜索的关键词进行解析,然后再在建立好的索引上面进行查找,最终返回和用户输入的关键词相关联的文档。
- LUCENE入门(一)
- Lucene入门(一)
- Lucene入门一(转)
- Lucene基础(一)--入门
- Lucene入门的基本知识(一)
- 全文索引 (一)入门 hello lucene
- Lucene使用入门指南 (一)
- 全文检索Lucene(一)---快速入门
- Lucene(入门一)
- Lucene入门详解(一)
- lucene入门学习一
- Lucene 6.1.0 入门一
- lucene笔记(一)
- lucene 漫谈(一)
- lucene学习(一)
- Lucene入门教程(一)
- Lucene入门教程(一)
- Lucene同义词(一)
- HTML5中的本地、WebSql、离线应用存储
- 使用eclipse中的maven搭建java ee项目
- LeetCode - Maxmimum Gap
- Android 回调方法使用
- 集合代数
- Lucene入门(一)
- 开源 java CMS - FreeCMS2.3 会员权限管理
- 2015.4.16
- toggleClass() 方法
- Android View的setContentView和inflate
- HDR(High-Dynamic Range)高动态光照渲染
- 第1题 - 判断所有字符(ASCII)全不相同(Java)
- 异或运算实现两个数的交换
- Selenium自动化持续集成问题记录