信息检索评价指标NDCG、a-NDCG
来源:互联网 发布:linux if语句的用法 编辑:程序博客网 时间:2024/05/21 06:31
PAMM中使用的检索多样性的评估方法为:。
在NDCG中,文档的相关度可以分为多个等级进行打分。
(1)CG(Cumulative Gain):
表示前p个位置累计得到的效益,公式为:
其中rel表示第i个文档的相关等级,如2表示非常相关,1表示相关,0表示无关,-1表示垃圾文件。
(2)DCG(Discounted Cumulative gain)
在CG中的计算没有考虑到位置信息,比如检索到了三个文档相关度一次为(3,-1,1)和(-1,1,3),显然前面的排序好一点,但是两个排名的CG值是相同的,所以要在CG运算中中加入位置信息的计算。假设每个位置按照从小到大排序,它们的价值依次递减,如:假设第i个位置的价值为。
DCG的公式为:
另一种比较常用的,用来增加相关度影响比重的DCG计算方式是:
(3)IDCG(ideal DCG)
IDCG是指理想情况下的DCG,即DCG取得最大值的情况。公式为:
其中|REL|表示文档按照相关性从大到小的顺序排序,取前p个文档组成的集合。
(4)NDCG(Normalize DCG)
由于每个查询语句所能检索到的结果文档集合长度不一,p值的不同会对DCG的计算有较大的影响。所以不能对不同查询语句的DCG进行求平均,需要进行归一化处理。NDCG就是用IDCG进行归一化处理,表示当前DCG比IDCG还差多大的距离。公式如下:
这样每个查询语句的NDCG就是从0到1,不同查询语句之间就可以做比较,就可以求多个查询语句的平均NDCG。NDCG@10、NDCG@20分别表示求p为10和20的时候的NDCG。
(5)PAMM中的
是NDCG的变形,其中新发现的subtopics被奖励,多余的subtopics被惩罚。等级k的得分可以通过将标准NDCG@k中的原始增益值替换为新颖性收益来定义。公式为:
其中是排名列表y中排在r位置的新颖性收益;
是包含第s个subtopic的r-1排名内观察到的文档数目;
为在正排名中排在r位的新颖性收益;
y(k)是排名为k的文档索引;
参数通常设置为0.5 。
- 信息检索评价指标NDCG、a-NDCG
- NDCG评价指标讲解
- 信息检索中常用的评价指标:MAP,nDCG,ERR,F-measure
- 信息检索的评价指标 precision recall F1 mAP NDCG MRR ROC
- 信息检索中常用的评价指标:MAP,nDCG,ERR,F-measure
- IR的评价指标:NDCG
- nDCG, 排序模型评价指标
- learning to rank 评价指标 MAP NDCG
- IR的评价指标-MAP和NDCG
- 信息检索系统常用的评价指标(准确率,召回率,F1,MAP,NDCG)
- NDCG
- NDCG
- 评价标准NDCG
- NDCG 评价标准
- IR的评价指标—MAP,NDCG,MRR
- IR的评价指标-MAP,NDCG和MRR
- IR的评价指标-MAP,NDCG和MRR
- 排序指标NDCG
- 关于用51单片机制作计算机
- 解决PyCharm安装Scrapy框架Microsoft Visual C++ 14.0 is required问题
- 小白入门:大型网站技术架构负载均衡技术
- 013大数据课程知识点小结
- JavaScript CSS-DOM技术
- 信息检索评价指标NDCG、a-NDCG
- 深记“volatile”的重要性
- C语言学习历程(十)“函数指针”与“指针型函数”
- HDU
- Ubuntu查看系统的各种版本信息
- 利用Python制作简单的中英翻译器
- 二叉树部分相关练习题
- 视频监控安防平台-GB28181-exosip协议栈系统刷新订阅
- 4 technology trends to watch in 2016