结合lucene实现大数据的like模糊查询

来源：互联网发布：时间轴软件编辑：程序博客网时间：2024/06/06 17:00

需求

很多时候我们在用数据库的需要使用模糊查询，我们一般会使用like语句来做，然而这样的做的效率不是很多（很抱歉我们亲自去测，很多都这么说的），那么使用Lucene来检索的话，效率会高很多。

lucene结合数据库步骤

写一段传统的JDBC程序，将每条的用户信息从数据库读取出来
针对每条用户记录，建立一个lucene document
Document doc = new Document();
并根据你的需要，将用户信息的各个字段对应luncene document中的field 进行添加，如：
doc.add(new Field(“NAME”,”USERNAME”,Field.Store.YES,Field.Index.UN_TOKENIZED));
然后将该条doc加入到索引中，如： luceneWriter.addDocument(doc);
这样就建立了lucene的索引库
编写对索引库的搜索程序（看lucene文档），通过对lucene的索引库的查找，你可以快速找到对应记录的ID
通过ID到数据库中查找相关记录

注意
1. 在索引的过程中，可以使用增量的方式建立索引，这样对已经索引的记录不在建立索引。实现思路：保存上次（lasttime）的新增时候的id,在建立索引的时候，值查询这个id之后的记录进行索引，更新这个记录下来的id，在数据库数据修改时候，针对这个数据制作索引的修改
2.如果不用Lucene，也可以用数据库本身的“全文索引”这个很不常用的东西。oracle和mysql的新版本都支持全文索引，不喜欢Lucene的可以用这种方法。但是，但是，全文索引的本质和Lucene是一模一样的。

更多代码参考：http://blog.csdn.net/fun913510024/article/details/46289793

0 0