lucene 索引创建域选项

来源:互联网 发布:手机自己制作软件 编辑:程序博客网 时间:2024/04/30 19:35

一、域索引选项:
 

//Field.Index(索引域选项)//Index.ANALYZED:进行分词和索引,适用于标题、内容等//Index.NOT_ANALYZED:进行索引,但是不进行分词,如果身份证号,姓名,ID等,适用于精确搜索//Index.ANALYZED_NOT_NORMS:进行分词但是不存储norms信息,这个norms中包括了创建索引的时间和权值等信息//Index.NOT_ANALYZED_NOT_NORMS:即不进行分词也不存储norms信息//Index.NO:不进行索引

 

二、域存储选项:

//Field.Store.YES或者NO(存储域选项)//设置为YES表示或把这个域中的内容完全存储到文件中,方便进行文本的还原//设置为NO表示把这个域的内容不存储到文件中,但是可以被索引,此时内容无法完全还原(doc.get)

 

三、最佳实践:

ANALYZEDYES文档标题和摘要ANALYZEDNO文档正文NOT_ANALYZEDYES标识符(主键、文件名),电话号码、身份证号,姓名,日期NOT_ANALYZEDNO隐藏关键字NOYES文档类型,数据库主键(不进行索引)
示例代码:

/** * lucene 索引创建域选项 * @author lenovo * */public class IndexUtil {private String[] ids={"1","2","3","4","5","6"};private String[] emails={"wbb@126.com","aaa@126.com","bbb@126.com","ccc@126.com","ddd@126.com","fff@126.com"};private String[] contents={"dfh fdhx fbxf bxfh f","dfjtyfhfd rhdbdx zhfxvz","tt tfv dgfb  zzbz zfgdf"                 ,"edd dseg dfd","dgdz sdfs sfzs","dsgzc zcsg dsd sdsd"};private int[] attachs={2,3,4,0,5,2};private String[] names={"wbb1","wbb2","wbb3","wbb4","wbb5","wbb6"};private Directory directory=null;public IndexUtil(){try {//创建directorydirectory=FSDirectory.open(new File("E:/luceneWorkspace/test/index02"));} catch (IOException e) {e.printStackTrace();}}public void index(){IndexWriter writer=null;try {//创建writerwriter=new IndexWriter(directory, new IndexWriterConfig(Version.LUCENE_36,new StandardAnalyzer(Version.LUCENE_36)));Document doc=null;for (int i = 0; i < ids.length; i++) {//创建文档  并且添加索引和域//文档相当于表中的每一条数据    域相当于字段doc=new Document();//Field.Store.YES或者NO(存储域选项)//设置为YES表示或把这个域中的内容完全存储到文件中,方便进行文本的还原//设置为NO表示把这个域的内容不存储到文件中,但是可以被索引,此时内容无法完全还原(doc.get)//Field.Index(索引域选项)//Index.ANALYZED:进行分词和索引,适用于标题、内容等//Index.NOT_ANALYZED:进行索引,但是不进行分词,如果身份证号,姓名,ID等,适用于精确搜索//Index.ANALYZED_NOT_NORMS:进行分词但是不存储norms信息,这个norms中包括了创建索引的时间和权值等信息//Index.NOT_ANALYZED_NOT_NORMS:即不进行分词也不存储norms信息//Index.NO:不进行索引doc.add(new Field("id",ids[i],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));doc.add(new Field("email",emails[i],Field.Store.YES,Field.Index.NOT_ANALYZED));doc.add(new Field("content",contents[i],Field.Store.NO,Field.Index.ANALYZED));doc.add(new Field("name",names[i],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));//将文档写到索引中writer.addDocument(doc);}} catch (Exception e) {e.printStackTrace();}finally{if(writer!=null){try {writer.close();} catch (CorruptIndexException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();}}}}public void query(){try {//创建readerIndexReader reader=IndexReader.open(directory);//通过reader可以获取文档的数量System.out.println("numDocs:"+reader.numDocs());System.out.println("maxDocs:"+reader.maxDoc());reader.close();} catch (CorruptIndexException e) {// TODO Auto-generated catch blocke.printStackTrace();} catch (IOException e) {// TODO Auto-generated catch blocke.printStackTrace();}}}


 

以上内容主要是回顾创建索引---》怎么设置域--》查询索引

 

 

 

原创粉丝点击