FuzzyQuery模糊查找

来源:互联网 发布:软件新城西安 上下班 编辑:程序博客网 时间:2024/05/22 12:53
/*
 * 这种模糊搜索的方法是根据用户输入的单个字进行字符串间的查找,
 * 这种算法被称为levenshtein算法。
 * 这种算法在比较两个字符串时会会将动作分为三种,
 * 加上一个字母,删一个字母,改变一个字母。两个字符串之间进行比较时
 * 就是在执行将其中一个字符串,转变为另一个字符串的操作,
 * 没执行一次上述的操作,则相应的就会扣除一定的分数。
 * 当比较完毕后,也就是转变完成,此时的得分被称为两者之间的距离
 * 也可以称为模糊度。
 * */
package query;


import java.io.IOException;


import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.FuzzyQuery;
import org.apache.lucene.search.Hits;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.MultiPhraseQuery;


public class FuzzyQueryTest {



public FuzzyQueryTest(String INDEX_STORE_PATH){
try{
IndexWriter writer = new IndexWriter(INDEX_STORE_PATH, new StandardAnalyzer(), true);
writer.setUseCompoundFile(false);

//创建3个文档
Document doc1 = new Document();
Document doc2 = new Document();
Document doc3 = new Document();

Field f1 = new Field("content", "word", Field.Store.YES, Field.Index.TOKENIZED);
Field f2 = new Field("content", "work", Field.Store.YES, Field.Index.TOKENIZED);
Field f3 = new Field("content", "world", Field.Store.YES, Field.Index.TOKENIZED);

doc1.add(f1);
doc2.add(f2);
doc3.add(f3);

writer.addDocument(doc1);
writer.addDocument(doc2);
writer.addDocument(doc3);
writer.close();

IndexSearcher searcher = new IndexSearcher(INDEX_STORE_PATH);

//构建一个Term对象,然后对其进行模糊查找
Term t = new Term("content","work");
FuzzyQuery query = new FuzzyQuery(t);

//打印查询结构
Hits hits = searcher.search(query);
for(int i = 0; i < hits.length(); i++){
System.out.println(hits.doc(i));
}
}catch(IOException e){
e.printStackTrace();
}

}
public static void main(String[] args) {
// TODO Auto-generated method stub
System.out.println("即将进行模糊查找----------------->>>>>>>");
System.out.println("正在进行模糊查找");
FuzzyQueryTest fq = new FuzzyQueryTest("E:\\Lucene项目\\索引文件");
System.out.println("正在进行模糊查找");
System.out.println("查找结束----------------------->>>>>>>>");
}


}
0 0
原创粉丝点击