一、评价指标
来源:互联网 发布:软件行业目标市场分析 编辑:程序博客网 时间:2024/04/30 02:30
一、准确率、召回率、F1值
二、PR曲线、ROC曲线、AUC
(1)概念
在很多情况下,我们可根据学习器的预测结果对样例进行排序,排在前面的是学习器认为“最可能”是正例的样本,
排在最后的则是学习器认为“最不可能”是正例的样本。按此顺序逐个把样本作为整理进行预测,则每次可以计算出当前的查全率、查准率,以P(查准率)为纵轴,R(查全率)为横轴作图,就得到了P-R曲线P-R图直观的显
示出学习器在样本总体上的查全率、查准率,在进行比较时,若一个学习器的P-R曲线被另一个完全包住,则可断言后者优于前者,如图1,A优于C;如果两个学习器的P-R曲线发生了交叉,如A和B,则难以一般性的断言两
者孰优孰劣,只能在具体的P或R条件下进行比较。然而,在很多情形下,人们往往仍希望把学习器A和B比个高低,这时一个比较合理的判断依据是比较曲线下面积的大小,它在一定程度上表征了学习器在P和R上取得相对“双高”的比例,但这个值不太容易估算,因此人们设计了一些综合考虑P和R的度量。平衡点(BEP)就是这样一个度量,是P=R时的取值,基于BEP,可任务A优于B。
图1 P-R曲线
以召回率(真正率)为y轴,以特异性(假正率)为x轴,我们就直接得到了RoC曲线。从召回率和特异性的定义可以理解,召回率越高,特异性越小,我们的模型和算法就越高效。也就是画出来的RoC曲线越靠近左上越好。如下图左图所示。从几何的角度讲,RoC曲线下方的面积越大越大,则模型越优。所以有时候我们用RoC曲线下的面积,即AUC(Area Under Curve)值来作为算法和模型好坏的标准。
(2)如何画ROC曲线
In signal detection theory, a receiver operating characteristic (ROC), or simply ROC curve, is a graphical plot which illustrates the performance of a binary classifier system as its discrimination threshold is varied.
(3)ROC曲线与PR曲线的关系
ROC曲线有个很好的特性:当测试集中的正负样本的分布变化的时候,ROC曲线能够保持不变。
PR曲线会面临一个问题,当需要获得更高recall时,model需要输出更多的样本,precision可能会伴随出现下降/不变/升高,得到的曲线会出现浮动差异(出现锯齿),无法像ROC一样保证单调性。
AUC用得比较多的一个重要原因是,实际环境中正负样本极不均衡,PR曲线无法很好反映出分类器性能,而ROC受此影响小。
三、K-S值
ROC曲线及AUC系数主要用来检验模型对客户进行正确排序的能力。ROC曲线描述了在一定累计好客户比例下的累计坏客户的比例,模型的分别能力越强,ROC曲线越往左上角靠近。AUC系数表示ROC曲线下方的面积。AUC系数越高,模型的风险区分能力越强。
- 一、评价指标
- 聚类评价指标(一)
- 评价指标
- 评价指标
- 目标检测(一)目标检测评价指标
- 多标记评价指标(一)——HammingLoss
- 目标检测(一)目标检测评价指标
- MANET性能评价指标
- 分类器评价指标
- 学术论文评价指标
- 分类器评价指标
- svm评价指标公式
- 图像质量评价指标
- 聚类评价指标
- 推荐系统评价指标
- 机器学习评价指标
- 并行计算评价指标
- 推荐系统评价指标
- postfix邮件服务器搭建笔记
- linux c 信号量编程
- 用S3Browser对S3做数据同步
- java中Collection接口&List接口
- webpack打包技术
- 一、评价指标
- MFC多线程编程做时间显示程序
- Kotlin学习(1)概述
- STM32获取DHT11温度传感器数据
- 【Data Structure/Algorithm】排序之冒泡排序
- 再起航,我的学习笔记之JavaScript设计模式25(迭代器模式)
- Codeforces Round #435 (Div. 2)C. Mahmoud and Ehab and the xor(异或的性质)
- 【bzoj 1566】管道取珠(DP)
- Python numpy函数:linspace()创建等差数列