Lucene 五个基础的类初探
来源:互联网 发布:中学生网络问卷调查 编辑:程序博客网 时间:2024/05/22 04:31
http://lucene.apache.org/ 官方站点
http://lucene.com.cn/ LUCENE 中国
使用Lucene 建立索引时我们必须了解的5个基础的东西:
1.Document
Document 是用来描述文档的,这里的文档可以指一个 HTML 页面,一封电子邮件,或者是一个文本文件。一个 Document 对象由多个 Field 对象组成的。可以把一个 Document 对象想象成数据库中的一个记录,而每个 Field 对象就是记录的一个字段。
2.Field
Field 对象是用来描述一个文档的某个属性的,比如一封电子邮件的标题和内容可以用两个 Field 对象分别描述。
3.Analyzer(分析)
在一个文档被索引之前,首先需要对文档内容进行分词处理,这部分工作就是由 Analyzer 来做的。Analyzer 类是一个抽象类,它有多个实现。针对不同的语言和应用需要选择适合的 Analyzer。Analyzer 把分词后的内容交给 IndexWriter 来建立索引。
4.IndexWriter
IndexWriter 是 Lucene 用来创建索引的一个核心的类,他的作用是把一个个的 Document 对象加到索引中来。
5.Directory(目录 索引的存储的位置)
这个类代表了 Lucene 的索引的存储的位置,这是一个抽象类,它目前有两个实现,第一个是 FSDirectory,它表示一个存储在文件系统中的索引的位置。第二个是 RAMDirectory,它表示一个存储在内存当中的索引的位置。
- Lucene 五个基础的类初探
- Lucene初探
- 初探Lucene
- Lucene初探
- Lucene初探
- Lucene 初探
- Lucene初探
- Lucene初探
- Lucene初探
- 搜索系统19:lucene索引的五个关键知识点
- linux基础:配置GRUB的五个参数
- 必须了解的五个服务器基础问题
- 必须了解的五个服务器基础问题
- 集成模型的五个基础问题
- lucene中文索引初探
- Lucene分词初探---LetterTokenizer
- [lucene]初探bobo-browse
- Lucene.net初探
- 我的WCF之旅(2):Endpoint Overview
- IIS 6.0下安装SSL数字证书实现https访问
- 深入理解Linux内核中的链表
- weblogic自动部署没有生效的情况
- PHP相关杂项知识
- Lucene 五个基础的类初探
- [转载]IPMSG(飞鸽传书)协议翻译
- Meta标签详解
- L.A.M.P 环境部署详细步骤(转帖-http://www.phpchina.com/html/70/t-14270.html)
- 人生十大逻辑
- Ubuntu 8.10 学习点滴积累 Makefile Makefile:2: *** 遗漏分隔符 。 停止。Gcc
- Using getResponseBodyAsStream instead is recommended解决方法
- A simple GetOpenFileName example
- Winform 中listBox 控件的数据源捆绑和选中值读取