理解Lucene索引过程
来源:互联网 发布:网络限制指令 编辑:程序博客网 时间:2024/06/05 09:29
理解索引过程
Lucene索引过程分为三个主要的阶段:将数据转换为文本、分析文本、将分析过的文本保存到索引库中
1 转换成文本
在索引之前,必须将数据转换为Lucene可以处理的格式——纯文本字符流。
2 分析
完成了针对待索引数据的预处理,并创建了带有若干个域的Document对象,就可以调用IndexWriter的addDocument(Document)方法,将数据传递给Lucene来进行索引操作。
对数据进行索引处理时,Lucene会首先分析数据使之更适合被索引。分析数据时,先将文本数据切分成一些词汇单元tokens,然后对它们进行一些可选操作。
3 将分析后的数据写入索引
Lucene将输入数据以倒排索引的数据结构进行存储。(这种data structure可以迅速回答诸如“哪些文档包含词汇x?”一类的问题)
- lucene-理解索引过程
- 理解Lucene索引过程
- Lucene索引过程核心类的简单理解
- Lucene入门教程(二)- 理解索引过程的核心类
- Lucene入门教程(二)- 理解索引过程的核心类
- Lucene入门教程(二)- 理解索引过程的核心类
- lucene索引过程详解
- Lucene索引过程详解
- Lucene索引创建过程
- Lucene创建索引的过程
- Lucene 索引和搜索过程
- lucene 搜索引擎 创建索引过程
- lucene建立索引的过程
- Lucene索引创建过程2
- Lucene索引创建过程概述
- 通过Lucene索引文件学习Lucene索引过程
- lucene-2.9.0 索引过程(一) TermsHashPerField
- lucene-2.9.0 索引过程(二) FreqProxTermsWriter
- 阿里巴巴笔试题 (2011年度)
- final 修饰符
- windows下网络操作
- ibatis学习(一)--ibatis介绍以及用例
- 远程计算器控制(包含wxPython,socket,thread)(初级水平)
- 理解Lucene索引过程
- Objective-C url encode/decode url加密解密
- 企业如何远程招聘到靠谱的程序员?--Codassium网页视频聊天工具
- 高速数据包存储发送技术实现
- 总结一下java中我认识的哈希码以及equals和==的区别
- 新发现数据量存"2013-5-14 6:20"smarty的date_format函数还能够认识,mysql也能自动识别?
- JS开发的WebGrid控件
- 【转载】C++中cin、cin.get()、cin.getline()、getline()、gets()函数详解
- [Cocos2D 2.x iOS 开发笔记2] 在Project中启用ARC