理解NDCG
来源:互联网 发布:js div大小改变事件 编辑:程序博客网 时间:2024/06/05 04:18
关于NDCG,wiki给点解释很详细,这里我谈谈我的理解。
NDCG(Normalized discounted cumulative gain):是用来衡量排序质量的指标。
其中一种计算公式如下:
先从理解CG,DCG入手。CG(cumulative gain),累积获得,指的是网页gain的累加。例如:
其是个不断累加的值,gain可以使自己定义的一种获得,用来衡量网页的相关性程度,上图中的gain定义如下:
DCG(Discounted Cumulative Gain),Discounted的factor为:
那么,NDCG就是被IDEA DCG规格化的值,即DCG/IDCG。
NDCG如何理解?对于搜索引擎,本质是用户搜一个query,引擎返回一个结果列表,那么如何衡量这个结果列表的好坏?我能够想到的是:
- 我们希望把最相关的结果放到排名最靠前的位置,因为大部分用户都是从上往下阅读的,那么最相关的在前面可以最大程度减少用户的阅读时间;
- 我们希望整个列表的结果尽可能的和query相关;
第一个条件的满足是首要的,而第二个条件的加入是保证整体结果质量,而这两个条件都体现在了NDCG里面,首先,计算NDCG,需要计算Gain,这个gain即是每条结果的质量的定义,NDCG把所有结果相加最终相加保证,整体质量越高的列表NDCG值越大。同时,Discounted的设计使得越靠前的结果权重越大,这保证了第一条,更相关的排在靠前的结果会有更大的NDCG值。从这两点看,以NDCG为优化目标,保证了搜索引擎在返回结果总体质量好的情况下,把更高质量结果排在更前面。
NDCG提供了一种计算方式,当我们有其他排名类似的需求的时候,NDCG都是值得参考的,其Gain以及Discounted的计算的变化可以产生很多其他有价值的metrics
参考文献:
http://en.wikipedia.org/wiki/NDCG
- 理解NDCG
- NDCG
- NDCG
- NDCG Normalized discounted cumulative gain 理解分析
- 信息检索评价指标NDCG、a-NDCG
- NDCG、AUC介绍
- NDCG评价指标讲解
- 评价标准NDCG
- NDCG 评价标准
- 排序指标NDCG
- NDCG及其实现
- IR的评价指标:NDCG
- NDCG和MAP的含义
- ndcg算法的python实现
- nDCG, 排序模型评价指标
- learning to rank 评价指标 MAP NDCG
- IR的评价指标-MAP和NDCG
- NDCG指标——qjzcy的博客
- LETO型空间光调制器(SLM)的安装
- ehcache详细分析
- Coursera台大机器学习课程笔记3 – 机器学习的可能性
- POI解析excel
- websocket实现android消息推送
- 理解NDCG
- 写出 文件 iOS
- 从零开始学习HyBrid App开发(一)What's HyBrid App?
- Android开发之实现锁屏功能
- 为什么 JavaScript仍将是程序员的首选
- bit-GAVUP-试一试这个博客,以后就拿来写技术文档了
- 2014.11.20简单赛车游戏
- UVA - 10911 Forming Quiz Teams 状态压缩
- 使用lucene,IKAnalyzer提取敏感词