结合lucene实现大数据的like模糊查询

来源:互联网 发布:时间轴软件 编辑:程序博客网 时间:2024/06/06 17:00

需求

很多时候我们在用数据库的需要使用模糊查询,我们一般会使用like语句来做,然而这样的做的效率不是很多(很抱歉我们亲自去测,很多都这么说的),那么使用Lucene来检索的话,效率会高很多。

lucene结合数据库步骤

  1. 写一段传统的JDBC程序,将每条的用户信息从数据库读取出来
  2. 针对每条用户记录,建立一个lucene document 
    Document doc = new Document(); 
    并根据你的需要,将用户信息的各个字段对应luncene document中的field 进行添加,如: 
    doc.add(new Field(“NAME”,”USERNAME”,Field.Store.YES,Field.Index.UN_TOKENIZED)); 
    然后将该条doc加入到索引中, 如: luceneWriter.addDocument(doc); 
    这样就建立了lucene的索引库
  3. 编写对索引库的搜索程序(看lucene文档),通过对lucene的索引库的查找,你可以快速找到对应记录的ID
  4. 通过ID到数据库中查找相关记录

注意 
1. 在索引的过程中,可以使用增量的方式建立索引,这样对已经索引的记录不在建立索引。实现思路:保存上次(lasttime)的新增时候的id,在建立索引的时候,值查询这个id之后的记录进行索引,更新这个记录下来的id,在数据库数据修改时候,针对这个数据制作索引的修改

2.如果不用Lucene,也可以用数据库本身的“全文索引”这个很不常用的东西。oracle和mysql的新版本都支持全文索引,不喜欢Lucene的可以用这种方法。但是,但是,全文索引的本质和Lucene是一模一样的。

更多代码参考:http://blog.csdn.net/fun913510024/article/details/46289793
0 0
原创粉丝点击