中文检索(分词、同义词、权重)
来源:互联网 发布:mac自带预览抠图 编辑:程序博客网 时间:2024/05/16 14:21
BooleanQuery booleanQuery=new BooleanQuery();
TermQuery query = null;
for(String s:list){
Term term1=new Term(字段1, s);
query1=new TermQuery(term1);
float weight1 = (float)2.0;
query1.setBoost(weight1);
Term term2=new Term(字段2, s);
query2=new TermQuery(term2);
float weight2 = (float)2.0;
query2.setBoost(weight2);
BooleanQuery bq=new BooleanQuery();
bq.add(query1, BooleanClause.Occur.MUST);
bq.add(query2, BooleanClause.Occur.MUST);
booleanQuery.add(bq, BooleanClause.Occur.SHOULD);
}
TopDocs topDocs = isearcher.search(booleanQuery ,20);
for(String s:list){
Term term=new Term(字段, s);
query=new TermQuery(term);
float weight = (float)2.0;
query.setBoost(weight);
booleanQuery.add(query , BooleanClause.Occur.SHOULD);
}
List<String> list = new ArrayList<String>();
Analyzer analyzer = new IKAnalyzer();
//获取Lucene的TokenStream对象
TokenStream ts = null;
try {
ts = analyzer.tokenStream(要分词的句子, new StringReader(要分词的句子));
//获取词元文本属性
CharTermAttribute term = ts.addAttribute(CharTermAttribute.class);
//重置TokenStream(重置StringReader)
ts.reset();
//迭代获取分词结果
while (ts.incrementToken()) {
list.add(term.toString());
}
//关闭TokenStream(关闭StringReader)
ts.end();
} catch (IOException e) {
e.printStackTrace();
} finally {
//释放TokenStream的所有资源
if(ts != null){
try {
ts.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
- 中文检索(分词、同义词、权重)
- paip.中文 分词 -- 同义词大全整理
- Lucene实现自定义中文同义词分词器
- Solr5.5 中文分词及同义词
- Elasticsearch2.3.4 配置同义词和中文分词
- solr中文同义词检索的配置讲解
- 全文检索之中文分词
- elasticsearch ik分词实现 中文、拼音、同义词搜索
- 中文分词中的trie检索树实现
- MySQL Fulltext 全文检索中文分词补丁
- SHOP++中文分词检索词库扩展
- 中文分词中的trie检索树实现
- 全文检索4(关于中文分词ICTCLAS分词系统)
- sphinx中文分词检索 如何让分词的精确度更高
- Lucene5中编写自定义同义词分词器(基于IK中文分词器)
- Lucene5中编写自定义同义词分词器(基于IK中文分词器)二
- solr6.6配置IK中文分词、IK扩展词、同义词、pinyin4j拼音分词
- mapreduce计算分词权重
- 如何利用socket进行HTTP访问
- windows下同一进程创建多份http的session方法
- C# 获取当前路径方法
- 异步执行返回页面内容 AddOnPreRenderCompleteAsync
- abap内表
- 中文检索(分词、同义词、权重)
- 如何正确理解ABBYY FineReader中的模式和语言
- socket发送方发送速率过快问题
- 代理模式
- 打开本地html
- Cool Edit Pro 2.0 Resample.xfm
- EditPlus 编写运行 Groovy
- http://elinux.org/Main_Page
- 金融系统平衡的问题