《统计学习方法》笔记——算法性能度量
来源:互联网 发布:r语言导入excel数据 编辑:程序博客网 时间:2024/05/29 02:17
- 错误率与精度
- 查全率查准率与F1系数
- ROC与AUC
- 代价敏感错误率与代价曲线
错误率与精度
错误率是分类错误的样本数栈样本总数的比例。
精度是分类正确的样本栈样本总数的比例。
对样例集D,分类错误率定义为:
精度定义为:
常用的精度度量指标有MAE,RMSE:
以协同过滤中该度量指标的应用为例进行描述如下:
MAE:
其中Pa,d表示预测评分值,ra,d表示测试集中的实际评分值,L表示测试集的大小
RMSE:
其中Pa,d表示预测评分值,ra,d表示测试集中的实际评分值,L表示测试集的大小
查全率、查准率与F1系数
对于二分类问题,可以将样例根据真实类别与预测类别的组合划分的真正例(true positive)、假正例(false positive)、真反例(true negative)、假反例(false negative),令TP、FP、TN、FN分别表示其对应的样例数。显然有TP+FP+TN+FN=样例总数。
查准率(Precision):
查全率(Recall):
注:查全率和查准率是一对矛盾的评价指标,一般不可能两个都高。
F1系数:
综合考虑了查全率和查准率。在实际应用中还可以根据对查全率和查准率的重视程度的不同而进行调整。
ROC与AUC
ROC曲线:使用“真正假率TPR”和“假正假率FPR”分别作为横、纵坐标,两者定义为:
真正假率TPR:
假正假率FPR:
得到的曲线称为“ROC曲线”。
AUC:则为ROC曲线与横、纵坐标围成的图形的面积。一般用来比较两种算法在采用ROC曲线作为评价指标的情况下的优劣。
代价敏感错误率与代价曲线
由于不同类型的错误所造成的的后果不同,所以为错分的情况引入了代价值。这里暂不详述。
目前暂时整理到这里,日后若有接触到新的评价指标再进行补充。
- 《统计学习方法》笔记——算法性能度量
- 《统计学习方法》笔记——决策树之ID3算法
- 《统计学习方法》笔记——朴素贝叶斯算法
- 统计学习方法第一章笔记——统计学习方法概论
- 统计学习方法笔记(1)——统计学习方法概论
- 统计学习方法笔记: CART算法
- 《统计学习方法笔记》——Logistic回归
- 《统计学习方法》笔记——AdaBoost
- 《统计学习方法》笔记——回归
- 统计学习方法——第一章学习笔记
- 统计学习方法—学习笔记(1)
- 统计学习笔记(1)——统计学习方法概论
- 统计学习笔记(1)——统计学习方法概论
- 统计学习笔记(1)——统计学习方法概论
- 统计学习笔记(1)——统计学习方法概论
- 统计学习笔记(1)——统计学习方法概论
- 统计学习笔记(1)——统计学习方法概论
- 感知机学习算法——统计学习方法笔记,代码实现
- Android利用android:indeterminateDrawable来实现ProgressBar三种方式
- 【MySQL】mysql的模糊查找
- Response输出导出Excel,解决文本前面的0被去掉的方法
- 算法谜题114 划线过点
- ref与out
- 《统计学习方法》笔记——算法性能度量
- [YTU]_1985( C语言实验——保留字母)
- STM32-中断优先级
- 模仿手机QQ底部导航栏Icon拖拽效果
- 225. Implement Stack using Queues
- 链表
- 18. 4Sum LeetCode题解
- java 批量修改文件夹下文件名
- leetcode 哈希表