lucene入门及安装配置

来源:互联网 发布:php连接数据库语句 编辑:程序博客网 时间:2024/05/20 10:20

lucene是一个开源的、apache基金会支持的一个小型项目,它可以支持全文索引,在搜索引擎中有非常广泛的应用,它也被称为倒排索引。我们可以利用它来进行对文本中所有文字的分类和统计相应的词频等操作。

LZ在这里主要是用lucene-4.0.0的开源jar包来进行入门实践和安装配置的。当然版本的不同,可能在配置上也会有点不同。首先是下载lucene-4.0.0的包,里面一共有analysis、core、demo和queryparser这四个包是需要配置在windows下的环境变量中的classpath中。分别是analysis/common下的lucene-analyzers-common-4.0.0.jar包、lucene-core-4.0.0.jar包、lucene-demo-4.0.0.jar包和lucene-queryparser-4.0.0.jar包。那么这四个包需要在classpath中配置相应的路径。


当然我们可以在cmd模式下采用echo %classpath%来查看具体这个环境变量所含有的内容,一般配置环境变量还是在本地下配置比较好,而不是在系统变量中配置。那么在cmd模式下继续输入

java org.apache.lucene.demo.IndexFiles -docs (filespath),那么接下来就是会对你给定的一些文章建索引,然后再用java org.apache.lucene.SearchFiles来对特定的某些文件查找关键字

0 0