lucene 文档评分 及 CustomScoreQuery

来源:互联网 发布:中国人工智能协会 编辑:程序博客网 时间:2024/05/28 03:04

1.评分

评分公式可见《lucence 文档评分公式》

2.解释

org.apache.lucene.search.Explanation
类,用于解释评分细节。
String org.apache.lucene.search.Explanation.toString()
文本格式输出。
String org.apache.lucene.search.Explanation.toHtml()
html格式输出。例子见图2-1.

图2-1 toHtml()格式的explanation

Explanation org.apache.lucene.search.IndexSearcher.explain(Query query, int doc)

给出doc对于query的评分。这个操作代价比较昂贵,等同于在整个索引上执行这个query。

3.自定义评分

场景:对最近修改过的文档进行加权。

3.1相关类

org.apache.lucene.queries.CustomScoreQuery
定制化评分的Query。
CustomScoreProvider org.apache.lucene.queries.CustomScoreQuery.getCustomScoreProvider(LeafReaderContext context)
拿到含有评分逻辑的CustomScoreProvider。
org.apache.lucene.queries.CustomScoreProvider
含有定制化评分逻辑的类。
float org.apache.lucene.queries.CustomScoreProvider.customScore(int doc, float subQueryScore, float valSrcScore)
一般会重写该方法。若认为这篇doc重要,可以return subQueryScore*加权程度。subQueryScore代表的是已有的评分,在此基础上进行干预更合理。


1 0
原创粉丝点击