Lucene 4.0 原理与代码分析

来源:互联网 发布:ipadpro必备软件推荐 编辑:程序博客网 时间:2024/05/22 04:34

  Lucene是全世界最优秀的全文搜索引擎之一,其鼎鼎大名只要是对搜索有一定了解的朋友都一定会有所耳闻,他有着非常优秀的性能和可扩展性,因此有很多身份显赫的后代,比如Solr和Nutch,都是apache基金会下的顶级项目,其已成为工业搜索引擎的基础,可谓是搜索引擎的“事实标准”;于此同时,由于apache基金会的优良运作以及apache开源协议的友好支持,成千上万的搜索技术发烧友和爱好者为Lucene做着默默的贡献,使其日渐完善并又不断进步着,学术界亦对其有着很大的兴趣,众多以学术研究为目的的修改和在发行版被开发出来,在各评测比赛中大放异彩,其中不乏比较优秀的Ivory等;Lucene起到了沟通学术界与工业界的作用。

  作为像我这样的信息检索的爱好者,Lucene是一个必须要好好研究的对象和工具,它就像一个引路者,指引着我向宝藏进发,沿途并不枯燥,时常能捡到一些检索技术的知识、一些高效算法和数据结构的知识、或是Java编程的技巧、甚至是代码和文档书写规范;最终的宝藏是一把顺手的利器,助我披荆斩棘,向更神秘的未知世界开拔!

  2012年8月14日,Lucene迎来了第4.0次的华丽蜕变,也是一个新的宝藏摆在面前,于是我又上路了……

  我想,或许是为了寻找同在这条路上朋友们的共鸣,或者只是记录这些点滴的收获,特开一个系列记录文章,望有朋自远方来,必不亦乐乎!

文章列表:

  • 一、检索模型与相似度评分算法
    • 1. 向量空间模型(VSM)    [2012年9月11日更新]

 

 

 

  原文链接:http://kevinma.cn/technology/lucene-4-analysis/2012-09-05
  作者:KeViNOne
  主页:http://kevinma.cn
  本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接及作者主页链接,否则保留追究法律责任的权利。

 

原创粉丝点击