Apache Lucene
来源:互联网 发布:如何做好淘宝店推广 编辑:程序博客网 时间:2024/05/22 01:51
1.Lucene -全文搜索引擎
Apache Lucene 是一个基于Java的全文搜索引擎,利用它可以轻易的为Java软件加入全文搜索引擎的功能。
Lucene最重要的工作是替文件的每一个字索引,索引让搜索娥效率比传统的逐字搜索高出很多。
Lucene 提供一组解析、过滤、分析文件,已经编排和实用索引的API。它的强大之处除了高效和简单外,最重要的是使开发者可以随时根据自己的需要自定义其功能。
2.Lucene是所中搜索引擎框架的基础。以下是基于Lucene的,分别实现了不同功能的拓展。
Nutch -全文搜索和网络爬虫
Solr -基于Lucene的全文搜索引擎框架
Compass -基于Lucene的搜索有引擎框架
LIUS-基于Lucene的多文件格式索引框架
WebLucene-基于Lucene和XML的网页索引引擎
3.原理
Lucene不是一个完整的全文索引应用,而是一个用Java写的全文索引引擎工具包,它可以嵌入到各种应用中实现针对应用的全文索引/检索功能。
Lucene进行索引,首先会将进行索引的文件存储到Lucene索引库,并对文档进行索引,然后搜索时使用搜索的API接口查到被索引的文档。
这一过程与数据库存入数据记录、创建索引、SQL查下的过程类似。
4工作过程
1.创建文档对象Document
2.IndexWriter保存文档索引(可以使用不同的中文分词器)
3.使用IndexSercher进行搜索
4.使用IndexReader删除索引
1 0
- Apache Lucene
- Apache Lucene
- Apache Lucene
- apache Lucene
- Apache Lucene - Scoring
- apache lucene介绍
- apache lucene cutom filter
- Apache Lucene 简介
- Apache Lucene Core
- Apache lucene solr
- Apache Lucene初探
- Apache Lucene初探
- Apache Lucene 新手使用指南
- apache lucene介绍
- Apache Lucene初探
- Apache Lucene初探
- Apache Lucene初探
- Apache Lucene初探
- 软件测试重点
- 图像形态学操作—腐蚀膨胀深入
- 使用记事本开发JAVA(HelloWorld)
- MobaXterm这个工具很好用
- 启用oracle 11g自动收集统计信息
- Apache Lucene
- Princeton Algorithms: Part 1 [week 2:Elementary Sorts]
- Android为何总是无法正常访问Tomcat服务器
- minhash算法
- Windows如何打包Qt程序
- 个人yum理解,本地yum源添加及推荐一个神奇的网站
- c语言全局变量和局部变量问题汇总
- 运用JS设置cookie、读取cookie、删除cookie
- 史上最全: svn与git的对比(二):svn与git的相关概念