Lucene搜索引擎

来源:互联网 发布:淘宝企业店铺负责人 编辑:程序博客网 时间:2024/04/20 03:54

Lucene入门教程:
http://blog.csdn.net/tianlincao/article/details/6867127/
Lucene教程:
http://www.cnblogs.com/zhuxiaojie/p/5277219.html

步骤:
1、索引创建
2、文本搜索

注意:
1、lucene的索引不能太大,要不然效率会很低。大于1G的时候就必须考虑分布索引的问题
2、不建议用多线程来建索引,产生的互锁问题很麻烦。经常发现索引被lock,无法重新建立的情况
3、中文分词是个大问题,目前免费的分词效果都很差。如果有能力还是自己实现一个分词模块,用最短路径的切分方法,网上有教材和demo源码,可以参考。
4、建增量索引的时候很耗cpu,在访问量大的时候会导致cpu的idle为0
5、默认的评分机制不太合理,需要根据自己的业务定制

原创粉丝点击