机器学习模型评价指标 -- 混淆矩阵
来源:互联网 发布:au录音软件win10 编辑:程序博客网 时间:2024/05/16 09:19
机器学习模型评价指标 – 混淆矩阵
在机器学习领域中,混淆矩阵(confusion matrix)是一种评价分类模型好坏的形象化展示工具。其中,矩阵的每一列表示的是模型预测的样本情况;矩阵的每一行表示的样本的真实情况。
1. 混淆矩阵的举例
例如用一个分类模型来判别一个水果是苹果还是梨,混淆矩阵将会模型的预测结果总结成如下表所示的表格。
通过上述表格可以看出,样本的数量一共是
2. 混淆矩阵
对于一个二分类的模型,其模型的混淆矩阵是一个
混淆矩阵比模型的精度的评价指标更能够详细地反映出模型的”好坏”。模型的精度指标,在正负样本数量不均衡的情况下,会出现容易误导的结果。
其中,列是模型预测的结果,行是样本真实的结果。四个矩阵元素的含义分别是:
2.1 True Positive
真正类(TP),样本的真实类别是正类,并且模型预测的结果也是正类。
2.2 False Negative
假负类(FN),样本的真实类别是正类,但是模型将其预测成为负类。
2.3 False Positive
假正类(FP),样本的真实类别是负类,但是模型将其预测成为正类。
2.4 True Negative
真负类(TN),样本的真实类别是负类,并且模型将其预测成为负类。
3. 混淆矩阵延伸出的各个评价指标
从混淆矩阵中,可以衍生出各种评价的指标。如下是截取的wiki上的一个截图(https://en.wikipedia.org/wiki/Confusion_matrix)
各个指标的定义以及含义如下所示:
3.1 Accuracy
模型的精度,即模型预测正确的个数 / 样本的总个数
一般情况下,模型的精度越高,说明模型的效果越好。
3.2 Positive predictive value (PPV, Precision)
查准率,阳性预测值,在模型预测为正类的样本中,真正为正类的样本所占的比例。
一般情况下,查准率越高,说明模型的效果越好。
3.3 False discovery rate (FDR)
错误发现率,表示在模型预测为正类的样本中,真正的负类的样本所占的比例。
一般情况下,错误发现率越小,说明模型的效果越好。
3.4 False omission rate (FOR)
错误遗漏率,表示在模型预测为负类的样本中,真正的正类所占的比例。即评价模型”遗漏”掉的正类的多少。
一般情况下,错误遗漏率越小,模型的效果越好。
3.5 Negative predictive value (NPV)
阴性预测值,在模型预测为负类的样本中,真正为负类的样本所占的比例。
一般情况下,NPV越高,说明的模型的效果越好。
3.6 True positive rate (TPR, Recall)
召回率,真正类率,表示的是,模型预测为正类的样本的数量,占总的正类样本数量的比值。
一般情况下,Recall越高,说明有更多的正类样本被模型预测正确,模型的效果越好。
3.7 False positive rate (FPR), Fall-out
假正率,表示的是,模型预测为正类的样本中,占模型负类样本数量的比值。
一般情况下,假正类率越低,说明模型的效果越好。
3.8 False negative rate (FNR), Miss rate
假负类率,缺失率,模型预测为负类的样本中,是正类的数量,占真实正类样本的比值。
缺失值越小,说明模型的效果越好。
3.9 True negative rate (TNR)
一般情况下,真负类率越高,说明的模型的效果越好
- 机器学习模型评价指标 -- 混淆矩阵
- 机器学习模型评价指标
- 机器学习模型评价指标
- 机器学习分类器模型评价指标
- 机器学习实战---详解模型评价指标
- 机器学习评价指标
- 【机器学习】评价指标
- 【机器学习】评价指标
- 机器学习评价指标
- 基于混淆矩阵的评价指标
- 机器学习模型评价指标及R实现
- 机器学习模型的评价指标和方法
- 机器学习模型评价指标准确率召回率精确率
- 机器学习算法评价指标
- 机器学习评价指标汇总
- 机器学习之评价指标
- 常见机器学习评价指标
- 混淆矩阵,机器学习评价准则,ROC曲线-阈值评价标准
- OpenCV 90°旋转
- linux nc命令相互发消息及传文件
- transcode_init()函数介绍
- CSS-字体
- 最小的应用(tkinter,Python3.x )
- 机器学习模型评价指标 -- 混淆矩阵
- 数据结构与算法之经典排序
- Codeforces 516A Drazil and Factorial【暴搜找规律+贪心】
- EventBus 3使用文档(二)
- 轻快的VIM(一):移动
- centos7 安装Nginx
- 算法整理-二分查找列表最大值
- 1. hadoop 1.0.0 source code
- Android事件分发机制