lucene介绍

来源:互联网 发布:安森奈斯 知乎 编辑:程序博客网 时间:2024/05/26 22:58

lucene是一个高性能、可伸缩性的信息检索(IR)库。它可以为你的应用程序添加索引和搜索能力。lucene是java实用的成熟、免费的开源项目,是著名的Apache Jakarta大家庭的一员,并且基于在Apache软件许可[ASE,License].注意:我们使用术语IR来描述像lucene这样的搜索工具。人们常常将IR库归诸于搜索引擎.但是一定不要将IR库与Web搜索引擎混为一谈。

lucene使你可以索引并能使得可以转换成文本格式的任何数据能够被搜索。lucene并不关心数据的来源、格式甚至它的语言,只要你能将它转换为文本。这就意味着你可经索引并搜索存放于文件中的数据。在远程服务器上的Web页面,存于本地文件系统的文档。简单的文本文件,微软Word文档,HTML或PDF文件或任何其它能够提取出文本信息的格式。同样,利用lucene你可以索引存放于DB中的数据,提供给用户很多DB没有的提供的全文搜索的能力。一旦你集成了lucene,你的应用程序的用户就能够像这样来搜索:+George+Rice -eat -pudding,Apple -pie +Tiger,animal;monkey AND food:abnana等等.利用lucene,你可以索引和搜索email邮件,邮件列表档案,即时聊天记录,你的Wiki页面等等更多。

原创粉丝点击