【信息检索导论】第11章 概率检索模型

来源:互联网 发布:淘宝全球购买手是什么 编辑:程序博客网 时间:2024/04/29 08:06

11章 概率检索模型

概率排序模型

利用概率模型来估计每篇文档和需求的相关概率P(R=1|d,q),然后对结果进行次序。这是PRPprobability ranking principle,概率排序原理)

最简单的PRP 情况是,检索没有任何代价因子,或者说不会对不同行为或错误采用不同的权重因子。在返回一篇不相关文档或者返回一篇相关文档不成功的情况下,将失去分(在计算精确率时这种基于二值的情形也往往称为1/0 风险)。而检索的目标是对于用户任意给定的k值,返回可能性最高的文档前篇作为结果输出。也就是说,PRP 希望可以按照P(R=1|d,q)值的降序来排列所有文档。当返回一个无序文档集而不是排序的结果时,可以通过贝叶斯最优决策原理(Bayes optimal decision rule)来基于最小损失风险作出决策,即返回相关的可能性大于不相关的可能性的文档

二值独立模型

本质上说,BIM 模型就是多元贝努利朴素贝叶斯模型。

概率模型的扩展

词项之间的树形依赖

BM25算法

IR中的贝叶斯网络方法:文档集网络、查询网络

原创粉丝点击