机器学习之评估指标

来源:互联网 发布:四字网络流行语 编辑:程序博客网 时间:2024/06/05 07:22

分类

混淆矩阵1

  • True Positive(真正, TP):将正类预测为正类数.
  • True Negative(真负 , TN):将负类预测为负类数.
  • False Positive(假正, FP):将负类预测为正类数 误报 (Type I error).
  • False Negative(假负 , FN):将正类预测为负类数 漏报 (Type II error).

    此处输入图片的描述

    精确率(precision)定义为:

    P=TPTP+FP(1)

    需要注意的是精确率(precision)和准确率(accuracy)是不一样的,

    ACC=TP+TNTP+TN+FP+FN

    在正负样本不平衡的情况下,准确率这个评价指标有很大的缺陷。比如在互联网广告里面,点击的数量是很少的,一般只有千分之几,如果用acc,即使全部预测成负类(不点击)acc 也有 99% 以上,没有意义。

    召回率(recall,sensitivity,true positive rate)定义为:

    R=TPTP+FN(2)

    此外,还有 F1值,是精确率和召回率的调和均值

    2F1F1=1P+1R=2TP2TP+FP+FN(3)精确率和准确率都高的情况下,F1值也会高。

    通俗版本

    刚开始接触这两个概念的时候总搞混,时间一长就记不清了。

    实际上非常简单,精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是对的。那么预测为正就有两种可能了,一种就是把正类预测为正类(TP),另一种就是把负类预测为正类(FP)。

    召回率是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。那也有两种可能,一种是把原来的正类预测成正类(TP),另一种就是把原来的正类预测为负类(FN)。

    此处输入图片的描述


    在信息检索领域,精确率和召回率又被称为查准率查全率


    ROC 曲线

    我们先来看下维基百科的定义,

    In signal detection theory, a receiver operating characteristic (ROC), or simply ROC curve, is a graphical plot which illustrates the performance of a binary classifier systemas its discrimination threshold is varied.

    比如在逻辑回归里面,我们会设一个阈值,大于这个值的为正类,小于这个值为负类。如果我们减小这个阀值,那么更多的样本会被识别为正类。这会提高正类的识别率,但同时也会使得更多的负类被错误识别为正类。为了形象化这一变化,在此引入 ROC ,ROC 曲线可以用于评价一个分类器好坏。

    ROC 关注两个指标,

    true positive rate:false positive rate:TPR=TPTP+FNFPR=FPFP+TN

    直观上,TPR 代表能将正例分对的概率,FPR 代表将负例错分为正例的概率。在 ROC 空间中,每个点的横坐标是 FPR,纵坐标是 TPR,这也就描绘了分类器在 TP(真正率)和 FP(假正率)间的 trade-off2

    此处输入图片的描述


    AUC

    AUC(Area Under Curve)被定义为ROC曲线下的面积,显然这个面积的数值不会大于1。

    The AUC value is equivalent to the probability that a randomly chosen positive example is ranked higher than a randomly chosen negative example.

    翻译过来就是,随机挑选一个正样本以及一个负样本,分类器判定正样本的值高于负样本的概率就是 AUC 值。

    简单说:AUC值越大的分类器,正确率越高3

    • AUC=1
  • 完美分类器,采用这个预测模型时,不管设定什么阈值都能得出完美预测。绝大多数预测的场合,不存在完美分类器。
  • 0.5<AUC<1
  • ,优于随机猜测。这个分类器(模型)妥善设定阈值的话,能有预测价值。
  • AUC=0.5
  • ,跟随机猜测一样(例:丢铜板),模型没有预测价值。
  • AUC<0.5,比随机猜测还差;但只要总是反预测而行,就优于随机猜测,因此不存在AUC<0.5
    • 的情况。

    此处输入图片的描述

    既然已经这么多评价标准,为什么还要使用ROC和AUC呢?因为ROC曲线有个很好的特性:当测试集中的正负样本的分布变化的时候,ROC曲线能够保持不变。在实际的数据集中经常会出现类不平衡(class imbalance)现象,即负样本比正样本多很多(或者相反)


    回归4

    平均绝对误差

    平均绝对误差MAE(Mean Absolute Error)又被称为 l1

    范数损失(l1-norm loss):

    MAE(y,y^)=1nsamplesi=1nsamples|yiy^i|

    平均平方误差

    平均平方误差 MSE(Mean Squared Error)又被称为 l2

    范数损失(l2-norm loss):

    MSE(y,y^)=1nsamplesi=1nsamples(yiy^i)2
0 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 剧烈运动恶心想吐怎么办 长跑之后 恶心想吐怎么办 喝咖啡后绞心痛怎么办 牛奶喝多了胃胀怎么办 运动后大量出汗头晕怎么办 屁股出汗淹的特别痛怎么办 运动完感觉很累怎么办 跑步后感觉很累怎么办 输液多了伤脾胃怎么办 运动完后特别晕怎么办 运动过量大腿肌肉酸痛怎么办 13岁发烧38.2度怎么办 头晕恶心想吐四肢无力怎么办 烧退了浑身疼怎么办 下午睡久了头疼怎么办 一天睡久了头疼怎么办 在家躺久了头疼怎么办 4周多儿童睡眠差怎么办 6岁儿童睡眠差怎么办 四年级的孩子不会写作文怎么办 四年级的孩子写不出作文怎么办? 欠了三万网贷怎么办 打完篮球浑身疼怎么办 在部队当兵意外死亡了怎么办 派派没有体力瓶怎么办 e记账登录不上怎么办 洁净净化区湿度高怎么办 政府测量土地少算了面积怎么办 北京武警欠我钱怎么办 被小混混打了怎么办 农保地建房子怎么办 WOW7.3到8.0橙装怎么办 90后离婚有孩子怎么办 90后的我们该怎么办 越南和中国结婚怎么办结婚证 改革怎么看走留怎么办事业怎么干 改革怎么看走留怎么办工作怎么干 军改怎么看我该怎么办 改革怎么办我该怎么干 改革怎么看 走留怎么办 腿又粗又弯怎么办